Intelligenza artificiale per la medicina di precisione

blue bright lights

Ricerca congiunta Federico II e Oracle per rendere fruibili e interoperabili dati sanitari non strutturati provenienti da varie fonti


Il grafo della conoscenza

L’intelligenza artificiale per la gestione dei big data può essere un fondamentale strumento per la medicina moderna. L’enorme quantità di informazioni sanitarie oggi disponibili in rete possono creare inutili allarmismi nel pubblico, ma anche generare importanti opportunità scientifiche per la “medicina di precisione”, il cui obiettivo è basare la prevenzione e la cura sulla storia clinica dei pazienti interessati. In questo ambito ogni giorno si moltiplicano applicazioni che spaziano dalla diagnostica alla chirurgia, fino allo sviluppo di farmaci e terapie di riabilitazione. Un importante progetto di ricerca in ambito e-health promosso dalla Federico II (tramite Picuslab e DIETI) in collaborazione con Oracle Corporation ha prodotto risultati sperimentali interessanti su un dataset di cartelle cliniche. In particolare la generazione automatica di un knowledge graph (KG) che consente di visualizzare dati ricavati da testi non strutturati (fondamentalmente diagnosi e refertazione) relativi a patologie cardiache. Il grafico è in grado di rispondere a molte delle possibili esigenze informative da parte di medici e pazienti, per es. i sintomi più comuni di una determinata patologia, o quale sia la terapia farmacologica più idonea in base all’anamnesi del paziente, ecc.

Oracle e il Dipartimento di Ingegneria Elettronica e Tecnologie dell’Informazione (DIETI) dell’Università Federico II hanno definito un progetto congiunto intitolato “Knowledge graphs for next-generation health science applications”, promosso da Gabriele Folchi, Strategy & Transformation Director per il Sud Europa di Oracle, e dall’ex direttore del Dipartimento, il professore Giorgio Ventre. Al progetto ha partecipato il professore Vincenzo Moscato, con il team di ricerca (PicusLab) che coinvolge, tra gli altri, il professore Carlo Sansone, il ricercatore Giancarlo Sperlì ed il dottorando Marco Postiglione. Per lo svolgimento delle attività la Oracle ha anche stanziato un contributo sotto forma di risorse computazionali in cloud. Le sfide affrontate dal progetto sono fondamentalmente nella difficoltà di decifrare enormi quantità di cartelle cliniche digitalizzate ma non propriamente strutturate: in pratica Electronic Health Records (EHR) eterogenei e costituiti da diverse tipologie di formato (immagini, testo, tabelle, numeri) in cui però si può individuare un legame con altri dati.

Un testo scritto frettolosamente da medici o infermieri in corsia, potrebbe ad esempio presentare refusi o abbreviazioni frequenti che l’analisi automatizzata potrebbe apprendere anche in ragione dei moderni sistemi di elaborazione del linguaggio naturale. Le relazioni tra cartelle cliniche potrebbero non sono essere espresse in maniera esplicita, come avviene ad esempio nei libri di testo, ma in un modo da decifrare. Il lavoro di analisi viene complicato ancor di più se le tecniche devono essere applicate su cartelle cliniche in lingua italiana, a causa della mancanza di dataset etichettati. Allo scopo di perfezionare le metodologie di analisi del testo non strutturato e l’individuazione automatica di relazioni tra termini medici, il team di ricerca ha instaurato una collaborazione con la sezione Cardiologia del Dipartimento di Scienze Biomediche Avanzate della Federico II diretta dal professore Giovanni Esposito. Il dataset di cartelle cliniche anonimizzate ha permesso di generare dei “grafi della conoscenza” facilmente leggibili i base alle risorse linguistiche disponibili in ambito biomedico. I KG possono inoltre essere usati per capire quanto un certo principio sia centrale rispetto ad un insieme di patologie, oppure quale sia stata la terapia migliore per una certa patologia in una determinata popolazione o ancora suggerire il farmaco più adatto. Infine, i KG possono essere interrogati da esperti per una visualizzazione rapida di una certa storia clinica oppure da bot o assistenti digitali per migliorare i processi di ricerca oppure da semplici utenti in cerca di informazioni. 

Laboratorio congiunto DIETI-ORACLE

Visti i risultati promettenti, la Oracle ha manifestato il suo interesse a creare un laboratorio congiunto tra il gruppo del DIETI guidato dal professor Moscato ed il suo team di Zurigo, aprendo anche alla possibilità di finanziare borse di studio per studenti di dottorato.