Intelligenza artificiale e qualità del dato sanitario - Seconda parte

La cultura del dato e dell’attenzione della qualità dello stesso devono evitare, anche nel settore sanitario, i possibili principali rischi di pregiudizi che possono influenzare lo sviluppo e l’implementazione degli algoritmi, evitando quindi ad esempio i bias algoritmici, (dovuti ad assunzioni errate nel processo di apprendimento automatico), i bias cognitivi (che si verificano quando la tecnologia richiede l’intervento umano e la fallibilità umana si insinua nel processo), i bias di conferma (che si verificano, in connessione ai bias cognitivi, quando l’IA si basa su tendenze preesistenti nei dati, confermando i pregiudizi esistenti e non identificando nuovi schemi o soluzioni), i bias di esclusione (quando dati importanti vengono esclusi dal dataset, perché lo sviluppatore non riesce a identificare fattori cruciali e nuovi), i bias di selezione o di misurazione (che si verificano quando il campione non riflette la popolazione che dovrebbe essere considerata).

La necessità di evitare possibili forme di discriminazione (anche appunto algoritmica) nel patrimonio informativo utilizzato per il machine learning si basa ancora una volta sulla qualità e l’esattezza dei dati, che sono uno dei principi essenziali del regolamento europeo in materia di protezione dei dati personali “GDPR”. Sono quindi anche un presupposto per l’efficacia delle analisi alla base dell’utilizzo dei big data ai fini dell’Intelligenza Artificiale, soprattutto in un settore così delicato come quello sanitario.

Il GDPR richiede che “i dati siano adeguati, pertinenti e limitati a quanto necessario rispetto alle finalità per le quali sono trattati; esatti e, se necessario, aggiornati”. Se infatti le serie statistiche o i dati con i quali gli algoritmi lavorano sono scorretti, anche il risultato del processo algoritmico su cui si fonda la diagnosi, la terapia o l’intervento possono risultare errati con effetti potenzialmente fatali per il paziente secondo il noto principio “garbage in, garbage out”. Anche il Garante per la Protezione dei Dati Personali italiano, nel Decalogo per la realizzazione di servizi sanitari nazionali attraverso sistemi di Intelligenza Artificiale,[1] pubblicato a settembre 2023, ha evidenziato i rischi derivanti dall’IA a partire dagli algoritmi, dalle possibilità di distorsioni, di dati di bassa qualità, di mancanza di trasparenza o utilizzo in contesti inappropriati, di fughe di dati personali, a causa di violazioni della privacy e della sicurezza nella raccolta dei dati o nell’esecuzione degli algoritmi di IA, di mancanza di chiarezza nella responsabilità per la gestione dell’IA – e per ogni possibile risultato sfavorevole. I dati sanitari necessitano di esattezza e qualità che il loro trattamento deve assicurare e proteggere, proprio per ridurre il rischio clinico rispetto all’utilizzo di strumenti fondati sull’Intelligenza Artificiale.

Il GDPR, insieme all’Artificial Intelligence Act, va proprio nella direzione di fornire lo statuto giuridico dell’IA, fondandolo sui principi di non esclusività della decisione algoritmica, che è derogabile solo in presenza di significative garanzie, di comprensibilità, e quindi di possibilità di discussione, non discriminazione, nella direzione di una complessiva accountability dei sistemi di IA.

La strutturazione del dato di qualità, così come anche suggerito dall’Organizzazione Mondiale della Sanità (OMS) nel report dell’ottobre 2023[2], passa attraverso un percorso che richiede:

• Trasparenza e documentazione: monitorando il ciclo di vita dei dati, i flussi informativi che li generano e i processi che si sviluppano dalla raccolta, identificando i ruoli e i soggetti che entrano nel percorso dei dati, fino alle destinazioni intermedie e finali; fare analisi sui dati, studiare indicatori di performance per imparare a gestire i processi in modo digitale, anche partendo dalla ricostruzione dei percorsi diagnostico-terapeutici, riscritti sulla base degli strumenti che possono fondarsi sulla digitalizzazione dei processi.

• Approccio attivo nella gestione del rischio: controllando gli interventi umani, verificando le minacce alla sicurezza informatica, modellizzando le soluzioni e minimizzando gli impatti; il dato deve essere governato anche in funzione della gestione del rischio clinico; i modelli di IA utilizzati per la classificazione delle immagini mediche, delle informazioni e dei dati sono suscettibili agli attacchi informatici, soprattutto durante la fase di addestramento o rinforzo: l’attacco può spingere il modello IA a riconoscere risultati diversi o, nell’uso clinico, ad aggiungere o rimuovere risultati nelle immagini per alterare la diagnosi finale, producendo infine un danno per il paziente; anche in questo caso, la protezione informatica riveste quindi un’enorme importanza nello sviluppo di strumenti diagnostico-terapeutici basati sull’IA.

• Convalida esterna dei dati: attraverso sistemi di destinazione d’uso e validazione analitica e clinica, la fornitura di evidenze oggettive (Evidence Based); il dato non aggiornato o inesatto influenzerebbe inoltre l’efficacia e la correttezza dei servizi che si basano sulla rielaborazione di tali dati.

• Rigorosa valutazione dei sistemi prima del rilascio: fondamentale per garantire che i sistemi non amplifichino distorsioni ed errori.

• Attenzione alla comprensione dell’ambito di applicazione della giurisdizione e dei requisiti di consenso: al servizio della privacy e della protezione dei dati, intesa nel senso di rispetto non solo della riservatezza, ma anche dell’integrità e disponibilità del dato.

• Promozione della collaborazione: tra gli organismi di regolamentazione, i pazienti, gli operatori sanitari, i rappresentanti del settore e i partner governativi, che può contribuire a garantire che i prodotti e i servizi rimangano conformi alle normative durante tutto il loro ciclo di vita.

Peraltro i progetti di IA hanno il vantaggio di risolvere il problema per cui i dati sanitari, spesso, provengono da fonti differenti, in quanto l’intelligenza artificiale è in grado d’individuarli e collegarli, elaborando un quadro più chiaro. A tale scopo è necessario lavorare non solo per ottenere interoperabilità dal punto di vista tecnico, ma anche da quello semantico ed organizzativo. La disomogeneità delle strategie sui dati che permane spesso non solo a livello di sistemi nazionale e regionale, ma talvolta anche a livello locale ed aziendale, evidenzia la necessità di competenze non solo tecniche ma anche manageriali per raggiungere governance omogenea. Le differenze semantiche ed organizzative producono frammentazione con dati difficili da mettere insieme: anche le tecnologie più avanzate non producono risultato e non risolvono i problemi senza una forte azione sinergica di governo, di change management, di formazione e di crescita professionale dei dipendenti, ma anche di empowerment dei cittadini.

L’intelligenza artificiale nella sanità pone molteplici sfide e opportunità: la sicurezza e l’efficacia dei sistemi di Intelligenza Artificiale non può quindi prescindere dalla promozione del dialogo tra le parti interessate, inclusi sviluppatori, enti regolatori, produttori, operatori sanitari e pazienti, per realizzare tecnologia e modelli organizzativi orientati al cambiamento nell’ottica di sviluppare servizi digitali per le persone attraverso la qualità e l’interoperabilità dei dati.

* Il contributo degli autori è a titolo personale e non impegna gli enti di afferenza.

Foto di Markus Spiske su Unsplash

[1] Per approfondimenti: https://www.garanteprivacy.it/documents/10160/0/Decalogo+per+la+realizzazione+di+servizi+sanitari+nazionali+attraverso+sistemi+di+Intelligenza+Artificiale.pdf/a5c4a24d-4823-e014-93bf-1543f1331670?version=2.0

[2] Per approfondimenti https://www.quotidianosanita.it/allegati/allegato1697706561.pdf