Quando parliamo di dati ‘sintetici’ facciamo riferimento a informazioni generate artificialmente tramite il ricorso all’Intelligenza Artificiale. Tali dati vengono creati utilizzando algoritmi e modelli statistici che replicano i modelli, le caratteristiche e le relazioni presenti nei dati del mondo reale. L’obiettivo è quello di produrre informazioni che assomiglino a quelle reali, ma che non contengano dettagli identificabili di individui. Un esempio pratico di questa tipologia di dati lo troviamo con le fotografie digitali di individui. Esistono immagini di persone che appaiono completamente realistiche, ma in realtà rappresentano individui inesistenti. La caratteristica principale è quindi l’assenza, teorica, della possibilità di risalire al gruppo originario partendo da quello artificiale. Ma quanto può in realtà incidere sulla privacy l’utilizzo di queste tecnologie? L’interrogativo sorge soprattutto a seguito del suo utilizzo in campo sanitario in Gran Bretagna, come apprendiamo dal Sole 24 ore.



Il settore sanitario emerge come un terreno fertile per lo sviluppo e l’implementazione dei dati sintetici, grazie alla loro efficacia nel superare le lacune o la scarsa qualità di dati sanitari e la salvaguardia della privacy. Le società farmaceutiche mostrano un particolare interesse per questa tecnologia, specialmente in contesti con restrizioni legislative che rendono la raccolta di dati un compito complesso. In particolare il servizio sanitario inglese sta facendo in questo senso da apripista.



DATI ‘SINTETICI’: COSA DESTA ANCORA DEI DUBBI

Il 21 novembre il servizio sanitario nazionale inglese (Nhs) ha assegnato a Palantir un contratto del valore di 330 milioni di sterline per costruire una nuova piattaforma, la Federated Data Platform allo scopo di raccogliere i dati provenienti da tutto il servizio sanitario nazionale in un unico archivio centrale, facilitando così l’analisi e la condivisione delle informazioni sui pazienti. L’accordo ha destato molto interesse perché Palantir è la società di software e di intelligenza artificiale nota anche per il suo lavoro legato al settore militare negli Stati Uniti. Con questo contratto gli Usa si assumono un ruolo delicato. Nhs è infatti il più grande servizio sanitario nazionalizzato al mondo e fornisce assistenza a più di 60 milioni di persone gestendo un’enorme quantità di dati molto sensibili tra cui cartelle cliniche, le cliniche personali, dati clinici e dati pubblici.



Inevitabili i dubbi su quale sia il giusto compromesso tra il progresso scientifico e la privacy . I dati sanitari sono infatti tra i più sensibili e non è un’impresa semplice mantenerli sicuri e, al tempo stesso, renderli accessibili per garantire il progresso scientifico. Proprio di questo compromesso tra protezione dei dati e benefici se ne è discusso a Londra dove Replica Analytics, una società attiva nella creazione di dati sintetici per il settore sanitario, ha riunito data scientist, legislatori e società farmaceutiche per discutere lo stato dell’arte.

L’ITALIA SI FARÀ INFLUENZARE DALL’INGHILTERRA?

L’Inghilterra sembra quindi essere un buon punto di riferimento, anche per l’Italia, per capire in che direzione si stia muovendo questo settore. “Abbiamo una regolamentazione che accoglie e inizia a disciplinare le tecniche di anonimizzazione, come la guida pubblicata dal garante inglese nel luglio del 2023″ dice Paul Comerford, consigliere tecnologico dell’Ico, l’ufficio del Garante inglese. Lo stesso ha anche aggiunto: “Ciò che appare comunque chiaro è che non abbiamo ancora una risposta, né una tecnica definitiva per quale sia il giusto compromesso tra utilità scientifica e privacy. Sebbene i dati sintetici e le tecniche di anonimizzazione siano promettenti, hanno comunque dei limiti.” Secondo Giuseppe D’Acquisto, consigliere tecnologico del Garante italiano, siamo in una fase sperimentale e con forti potenzialità, ma non esiste ancora una risposta univoca se i dati sintetici siano ritenuti completamente anonimizzati e quindi non sottoposti al Gdpr.

Quindi, se da un lato il diritto alla privacy è fondamentale, dall’altro i dati e l’intelligenza artificiale contribuiscono concretamente al progresso scientifico. Secondo D’Ambrosi “abbiamo tuttavia degli strumenti che ci possono aiutare a capire quale sia la strada. Il successo o il fallimento della piattaforma dell’Nhs ci darà sicuramente elementi in più per capire quale sia l’approccio migliore che dia benefici concreti per la salute pubblica e garantisca i diritti fondamentali. Attualmente paiono esserci prospettive positive di sviluppo.