AGI – Microsoft ha rivelato i dettagli di un sistema di intelligenza artificiale che offre prestazioni “migliori dei medici umani” nelle diagnosi complesse, aprendo la strada alla “superintelligenza medica“. L’unità di intelligenza artificiale dell’azienda, guidata dal pioniere tecnologico britannico Mustafa Suleyman, ha sviluppato un sistema che imita un gruppo di medici esperti che affrontano casi “diagnosticamente complessi e intellettualmente impegnativi”. Lo riporta il Guardian.
Secondo Microsoft, abbinato al modello avanzato di intelligenza artificiale o3 di OpenAI, il suo sistema ha “risolto” più di otto casi di studio su dieci, appositamente selezionati per la sfida diagnostica. Quando questi casi di studio sono stati testati su medici praticanti – che non avevano accesso a colleghi, libri di testo o chatbot – il tasso di accuratezza è stato di due su dieci.
L’IA come supporto, non sostituto dei medici
Pur evidenziando i potenziali risparmi sui costi derivanti dalla sua ricerca, Microsoft ha minimizzato le implicazioni occupazionali, affermando che l’intelligenza artificiale può integrare il lavoro dei medici piuttosto che sostituirlo. “Il loro ruolo clinico è molto più ampio della semplice diagnosi. Devono destreggiarsi nell’ambiguità e costruire un rapporto di fiducia con i pazienti e le loro famiglie, in un modo che l’IA non è in grado di fare”, scrive l’azienda in un post sul blog. Tuttavia, usare lo slogan “percorso verso la superintelligenza medica” solleva la prospettiva di un cambiamento radicale nel mercato sanitario. Mentre l’intelligenza artificiale generale si riferisce a sistemi che eguagliano le capacità cognitive umane in qualsiasi compito, “superintelligenza” è un termine altrettanto teorico che si riferisce a un sistema che supera le prestazioni intellettuali umane in tutti i settori.
Spiegando la logica alla base della ricerca, Microsoft ha sollevato dubbi sulla capacità dell’IA di ottenere un punteggio eccezionalmente alto nell’esame di abilitazione medica degli Stati Uniti, fondamentale per ottenere l’abilitazione medica negli Stati Uniti. I test a risposta multipla hanno favorito la memorizzazione delle risposte rispetto alla comprensione approfondita di un argomento, il che potrebbe contribuire a “sopravvalutare” la competenza di un modello di IA.
Microsoft sta sviluppando un sistema che, come un medico nel mondo reale, adotta misure passo dopo passo – come porre domande specifiche e richiedere test diagnostici – per arrivare a una diagnosi definitiva. Ad esempio, un paziente con sintomi di tosse e febbre potrebbe richiedere esami del sangue e una radiografia del torace prima che il medico arrivi a una diagnosi di polmonite.
Il ruolo di “orchestratore diagnostico”
Il nuovo approccio di Microsoft si basa su casi di studio complessi tratti dal New England Journal of Medicine (NEJM). Il team di Suleyman ha trasformato più di 300 di questi studi in “sfide interattive” che ha utilizzato per testare il suo approccio. L’approccio di Microsoft ha utilizzato modelli di intelligenza artificiale esistenti, inclusi quelli prodotti dallo sviluppatore di ChatGPT, OpenAI, Meta di Mark Zuckerberg, Anthropic, Grok di Elon Musk e Gemini di Google.
Microsoft ha quindi utilizzato un sistema di intelligenza artificiale su misura, simile a un agente, chiamato “orchestratore diagnostico” per lavorare con un modello specifico su quali test prescrivere e quale potrebbe essere la diagnosi. L’orchestratore, in effetti, imita un gruppo di medici, che poi formula la diagnosi. Secondo Microsoft il suo approccio è stato in grado di esercitare una “ampiezza e profondità di competenze” che va oltre i singoli medici, poiché poteva abbracciare più discipline mediche. “L’estensione di questo livello di ragionamento, e oltre, ha il potenziale di rimodellare l’assistenza sanitaria“, aggiunge, “L’intelligenza artificiale potrebbe consentire ai pazienti di autogestire gli aspetti di routine delle cure e fornire ai medici un supporto decisionale avanzato per i casi complessi”. Microsoft ha riconosciuto che il suo lavoro non è pronto per l’uso clinico e che sono necessari ulteriori test sul suo “orchestratore” per valutarne le prestazioni, ad esempio, sui sintomi più comuni.