Nel contesto dell’innovazione tecnologica, due concetti chiave che spesso vengono menzionati sono il Machine Learning (ML) e l’Intelligenza Artificiale (IA). A questi concetti si affianca anche quello di Statistical Learning (SL). Sebbene spesso utilizzati in modo intercambiabile, è importante comprendere le differenze fondamentali tra questi ambiti per apprezzarne appieno le potenzialità e le applicazioni, anche nel contesto di un confronto con la statistica medica e la metodologia epidemiologica.
L’Intelligenza Artificiale è un campo assai ampio che si occupa di creare sistemi in grado di eseguire compiti che richiedono caratteristiche normalmente attribuite all’intelligenza umana, come il ragionamento, la comprensione del linguaggio naturale, la percezione visiva e la assunzione di decisioni. L’IA comprende diverse sottodiscipline – oltre al ML e allo SL – quali il Natural Language Processing (Elaborazione del Linguaggio Naturale) e la Computer Vision (Visione Artificiale).
Le applicazioni dell’IA sono estremamente variegate e includono elaborazione di raccomandazioni, implementazione di veicoli autonomi, assistenti virtuali e robotica avanzata. Ad esempio, i veicoli autonomi utilizzano l’IA per percepire l’ambiente circostante, prendere decisioni in tempo reale e guidare in modo sicuro ed efficiente: si tratta di ambiti che passano anche sotto il nome di Cibernetica.
Il ML è una branca dell’IA che si concentra sull’abilità dei computer di apprendere dai dati senza essere esplicitamente programmati. In altre parole, i modelli di ML sono in grado di migliorare le proprie prestazioni man mano che ad essi pervengono nuovi dati, identificando pattern e relazioni nascoste per fare previsioni o prendere decisioni.
Le applicazioni del ML sono diffuse in diversi settori, tra cui la medicina, la finanza, la produzione e il marketing.
A fianco del ML, con un confine assai incerto, si colloca lo SL, dal quale si differenzia sia nel focus che nell’approccio utilizzato nell’analisi dei dati.
Per quanto concerne il focus, il ML si concentra sull’abilità del computer di apprendere dai dati senza essere specificamente programmato, se non con algoritmi generici di Learning, mentre lo SL si fonda sui principi dell’inferenza statistica per estrarre informazioni significative dai dati.
Dunque il ML mira a creare modelli predittivi efficienti, mentre lo SL si propone di comprendere il processo sottostante e formulare ipotesi sulla relazione tra le variabili.

Per giungere a questo obiettivo, il primo utilizza algoritmi complessi e modelli di apprendimento automatico, mentre il secondo si appoggia ai metodi statistici tradizionali.
Per ritornare al problema definitorio iniziale, la principale differenza tra ML e IA risiede nel fatto che il ML è una tecnica specifica utilizzata all’interno dell’ambito più ampio dell’IA. Mentre il ML si concentra sull’apprendimento automatico dai dati, l’IA abbraccia una vasta gamma di capacità cognitive e funzionalità che vanno oltre il semplice apprendimento automatico.
In sintesi, il ML rappresenta uno strumento fondamentale all’interno dell’ecosistema dell’IA, consentendo ai sistemi di apprendere dai dati e migliorare le proprie prestazioni nel tempo.
Comprendere questa distinzione è essenziale per apprezzare appieno il potenziale e le applicazioni di entrambi, che giocano un ruolo fondamentale nell’innovazione e nel miglioramento dei servizi sanitari pubblici, nella prevenzione delle malattie e nella personalizzazione delle cure.
È chiaro che l’approccio più immediatamente riferibile alla Statistica Medica è quello dello SL; tuttavia, ormai da diversi anni, la comunità dei biostatistici ha ampliato i propri orizzonti al ML e all’IA tout-court, come si può facilmente inferire dall’analisi delle applicazioni ai problemi di Sanità Pubblica.
Attualmente, uno degli ambiti prevalenti di applicazione è quello della diagnosi medica: in particolare, il ML viene utilizzato per analizzare immagini diagnostiche, come radiografie e scansioni MRI, per identificare precocemente patologie e supportare i medici nella diagnosi.
Inoltre, i modelli di ML possono analizzare dati epidemiologici e clinici per prevedere la diffusione di malattie infettive o per identificare potenziali epidemie in base a determinati parametri.
Ancora, attraverso l’analisi dei dati dei pazienti, il ML può aiutare a personalizzare i trattamenti medici in base alle caratteristiche individuali e alla risposta del paziente, occupando un ruolo primario nella prospettiva emergente della medicina personalizzata.

Per quanto riguarda l’impiego dell’IA nel campo della Salute Pubblica, essa può essere ad esempio efficacemente impiegata per sviluppare sistemi di raccomandazione personalizzati per promuovere stili di vita sani e migliorare la gestione delle malattie croniche.
Inoltre, attraverso l’utilizzo di dispositivi indossabili e sensori intelligenti, l’IA può monitorare costantemente lo stato di salute di un individuo e fornire avvisi precoci in caso di anomalie.
Ancora, l’IA può analizzare grandi quantità di dati provenienti da registri sanitari, studi clinici e altre fonti per identificare pattern, correlazioni e tendenze utili per migliorare la Salute Pubblica anche attraverso l’ottimizzazione della gestione delle risorse sanitarie.
Ma l’IA sta sviluppando rapidamente anche nuovi ambiti di intervento.
Ad esempio, nel 2019 un sistema denominato SENTINEL è stato introdotto per monitorare in tempo reale i social media alla ricerca di segnali di epidemie (Serban 2019). Questo approccio sfrutta le tecniche di IA per analizzare i dati e rilevare la diffusione di malattie infettive, e ha già dato buoni risultati durante l’epidemia di hantavirus in Cile e le epidemie di influenza (Chen 2017).
Già nel 2017, una ricerca nel campo dell’informatica sanitaria e dell’epidemiologia aveva evidenziato l’importanza dell’IA, con studi che analizzavano la relazione tra malattie, social media, emozioni pubbliche e reazioni eccessive durante epidemie come quella della sindrome respiratoria del Medio Oriente (MERS) in Corea (Choi 2017).
Ancora, l’IA ha dimostrato la possibilità di generare stime sulla prevalenza del cancro in aree prive di dati. Questo approccio potrebbe rivelarsi cruciale per la sorveglianza automatizzata della salute pubblica e per il monitoraggio costante delle condizioni di salute della popolazione. Inoltre, l’IA può svolgere un ruolo chiave nel rilevare e mappare malattie legate all’ambiente e ai comportamenti, come il cancro.
La combinazione di IA e statistica medica apre nuove prospettive per affrontare sfide complesse in sanità pubblica ed epidemiologia. L’analisi dei big data, supportata da tecniche avanzate di apprendimento automatico come il deep learning, consente di estrarre informazioni significative da enormi quantità di dati.
L’IA – intesa sensu lato, inclusi ML e SL – ha dimostrato di poter migliorare la precisione e l’efficienza delle diagnosi mediche, consentendo una personalizzazione dei trattamenti in base alle caratteristiche individuali dei pazienti. Inoltre, l’IA può supportare la valutazione dell’efficacia dei trattamenti e la previsione delle tendenze epidemiologiche, contribuendo così a una gestione più efficace delle risorse sanitarie.
In conclusione, l’integrazione tra IA e Statistica Medica rappresenta un’opportunità senza precedenti per migliorare la sorveglianza epidemiologica, la diagnosi precoce delle malattie e la gestione efficace della salute pubblica. L’innovazione continua in questo campo promette di trasformare radicalmente il modo in cui affrontiamo le sfide sanitarie globali, aprendo la strada a nuove scoperte e soluzioni per migliorare la qualità della vita delle persone.
Riferimenti bibliografici
Chen F, Neill DB (2017). Non-parametric scan statistics for event detection and forecasting in heterogeneous social media graphs. Proceedings of the 20th ACM
SIGKDD international conference on Knowledge discovery and data mining, 1166-1175
Choi S, Lee J, Kang MG, Min H, Chang YS, Yoon S (2017). Large-scale machine learning of media outlets for understanding public reactions to nation-wide viral infection outbreaks. Methods Inf Med 29: 50-59.
Serban O, Thapen N, Maginnis B, Hankin C, Foot V (2019). Real-time processing of social media with SENTINEL: a syndromic surveillance system incorporating deep learning for health classification. Inf Process Manage 56: 1166-1184
Immagine: Foto di Annie Spratt su Unsplash

