“Con un sufficiente quantitativo di dati i numeri parleranno da soli”. Questa era l’illusione del Ceo della 3D Robotics, Chris Anderson, quando sulla rivista online Wired nel 2008 dichiarava obsoleto il metodo scientifico, rimpiazzato dal potere degli algoritmi e da potenti computer in grado di macinare dati alla velocità della luce. Non è però questo quello che vediamo in questi giorni dominati dalla paura ingenerata dall’epidemia del Covid-19. I dati ci sembrano sempre meno chiari nella loro interpretazione. Sta effettivamente rallentando la diffusione del virus? O invece prosegue senza sosta?
Tra gli alti e i bassi della curva dei contagi è difficile intravvedere delle tendenze confortanti e molti hanno cominciato a dubitare dell’efficacia dei dati diffusi giornalmente dalla Protezione civile. Il numero di contagiati, si dice, dipende essenzialmente dal numero di tamponi effettuati. Più se ne effettuano, più risulterà elevato il novero di questi ultimi. Il numero morti, d’altra parte, potrebbe essere drammaticamente sottostimato in quanto i decessi verificatisi al di fuori degli ospedali potrebbero non essere classificati come decessi a causa del coronavirus. Il tasso di letalità osservato (denominato apparente) sarebbe poi solo una stima, probabilmente in eccesso, del tasso reale (detto “plausibile”) come hanno osservato gli studiosi dell’Ispi provando a meglio approssimarne il valore.
Nel distacco verso i dati ufficiali probabilmente gioca anche il fatto che ci si attendeva una progressione più veloce dell’epidemia o, almeno, un rapido cambiamento di tendenza che facesse, per così dire, intravedere la luce in fondo al tunnel, mentre i segnali discordanti di questi giorni, lungi da “parlare da soli” pronunciando parole di conforto, hanno invece generato una maggiore incertezza.
In questo quadro, sembra sempre più chiaro agli specialisti, ma anche ormai ai non addetti ai lavori, che la base informativa, sulla quale si sta cercando da settimane di costruire modelli previsivi, va migliorata per far sì che tali previsioni risultino maggiormente affidabili.
Abbiamo già argomentato su queste pagine lo scorso 24 marzo come un campione, per condurre a generalizzazioni soddisfacenti, debba essere osservato in condizioni pseudo-sperimentali come se si trattasse di un esperimento di laboratorio, seguendo precisi schemi di campionamento e non una raccolta dettata solo dalla convenienza o dall’emergenza. I dati che ci giungono in questi giorni non soddisfano queste caratteristiche ed è probabilmente giunta l’ora di mettere in campo un protocollo di osservazione campionaria dell’intera popolazione italiana seguendo un preciso disegno statistico. Solo in tal modo, passata l’emergenza e in fase di discesa dal picco, ci faremo trovare pronti per le decisioni che i responsabili politici e sanitari dovranno prendere circa il quando e il come le misure di lockdown dovranno essere prima ridotte e poi finalmente eliminate.
Detto ciò è pur vero che, con tutti i dubbi circa l’affidabilità della base di dati di partenza, il tempo che passa rende più lunga la serie di dati disponibili, così che l’andamento registrato dall’epidemia nelle settimane passate ci consente di verificare a posteriori se i modelli teorici che gli statistici stanno sottoponendo a verifica siano confermati o meno sulla base delle osservazioni empiriche (per una rassegna di carattere divulgativo di tali modelli si veda il sito della Società Italiana di Statistica).
È quindi interessante ritornare sulle domande che ci eravamo posti martedì scorso per verificare quanto le risposte che avevamo tentato di fornire in quel contesto si siano modificate e quanto si siano dimostrate attendibili.
Nell’articolo già citato si era detto che sono tre i momenti chiave di un’epidemia che è interessante cercare di prevedere, ovvero: il picco nel numero di contagi giornalieri, quando questi cominciano a decrescere; il picco nei contagi complessivi, quando comincia a diminuire il totale delle persone infette presenti nel paese; il momento in cui il numero di infetti scende finalmente a zero.
Per valutare come si sia evoluta l’epidemia in questa settimana relativamente a tali previsioni, confronteremo qui di seguito le risultanze che abbiamo commentato la settimana scorsa e quelle odierne. Relativamente alla previsione del primo picco tale dato è evidenziato nella Figura 1 (tanto tale tabella che le successive possono essere consultate insieme ad altro su questo sito).
Figura 1: Incremento giornaliero degli infetti. Andamento reale e previsione al 29 marzo. Fonte: Elaborazione http://covstat.it sulla base dei dati ufficiali della Protezione Civile.
Il grafico mostra come il nostro modello la settimana scorsa prevedesse che il picco degli infetti giornalieri avrebbe dovuto verificarsi nel periodo dal 24 al 31 marzo, ovvero in questi giorni. In effetti, i dati degli ultimi giorni avevano dato l’impressione illusoria di aver già raggiunto il picco al 24 marzo. I dati empirici ovviamente non seguono con regolarità le curve teoriche dei nostri modelli. Tuttavia, dall’andamento del grafico sembra di poter dire che ci stiamo muovendo in questi giorni in una fase di plateau, e che la discesa, se ancora non iniziata con decisione, dovrebbe iniziare a vedersi con maggiore chiarezza a partire dai prossimi giorni.
Relativamente al secondo momento cruciale, la Figura 2 riporta la previsione del picco dei contagiati totali a oggi. Esso risulta spostato in avanti rispetto a quanto avevamo previsto nel già citato precedente contributo. L’ intervallo oggi si prevede debba avvenire tra l’11 e il 17 aprile, quindi 2-3 giorni più avanti rispetto a quanto prevedevamo il 24 marzo (dove era tra l’8 e il 15 aprile).
Abbiamo già detto che questa deve essere presa come una buona notizia nonché una conferma dell’efficacia delle procedure di lockdown. Il picco che si sposta in avanti, infatti, da un lato ci consente di attrezzarci meglio alla situazione di emergenza guadagnando tempo per aumentare la capacità di accoglienza del nostro sistema sanitario, dall’altro consente di spalmare lo stesso numero di infetti su di un intervallo di tempo più ampio e di ridurre così il numero massimo di persone contemporaneamente infettate da coronavirus e che si rivolgono presso l’assistenza ospedaliera.
Figura 2: Andamento previsto per il numero totale di contagiati: previsione al 24/2 e previsione attuale. Fonte: Elaborazione http://covstat.it sulla base dei dati ufficiali della Protezione Civile.
A margine di questa nostra considerazione è prevedibile che in quel momento (tanto atteso) di svolta nella dinamica dell’epidemia non solo tutto il sistema sanitario sarà chiamato a fornire il massimo sforzo, ma anche, e soprattutto, le strutture di accoglienza in terapia intensiva. Questo aspetto, come ben sappiamo, rappresenta il collo di bottiglia più drammatico in quanto a esso è legato il rischio di non riuscire a fornire adeguate cure proprio ai pazienti più gravi e quindi di vedere innalzarsi ulteriormente la mortalità dovuta al virus.
L’andamento di questa ulteriore cruciale variabile epidemiologica è mostrato nella Figura 3. Essa mostra che la curva dei ricoverati in terapia intensiva, oltre a rimanere sotto la soglia della disponibilità di posti a livello nazionale, si discosta verso il basso dalla curva teorica ricavata dal nostro modello, mostrando come la dinamica, ancora tristemente accelerata, va pur tuttavia progressivamente rallentando rispetto alle previsioni.
Figura 3: Numero di pazienti in terapia intensiva. Evoluzione temporale dei valori effettivi e dei valori previsti rispetto ai posti disponibili. Fonte: Elaborazione http://covstat.it sulla base dei dati ufficiali della Protezione Civile.
Per concludere riporto qui di seguito un ulteriore grafico relativo al parametro detto “tasso di riproduzione dell’epidemia”. Esso rappresenta il numero medio di infezioni secondarie prodotte da ciascun individuo infetto in un intervallo di tempo. Esso misura, pertanto, la potenziale trasmissibilità di una malattia infettiva.
Valori superiori a 1 di tale tasso indicano un’epidemia in atto. Quando, al contrario, tale indice scende sotto a 1, l’epidemia comincia a regredire. Ogni infetto, in quel momento in media, contagia in media meno di una persona e dunque il numero di infetti regredisce e l’epidemia nel lungo termine si estinguerà.
Figura 4: Tasso di riproduzione del coronavirus in Italia tra il 25 febbraio ed il 29 marzo. Fonte: Elaborazione http://covstat.it sulla base dei dati ufficiali della Protezione Civile.
La Figura 4 mostra una tendenza alla costante decrescita di tale indicatore tra il 25 febbraio e il 29 marzo (tra gli alti e bassi connaturati con i criteri di raccolta dei dati). Da valori superiori a 2 registrati all’inizio del periodo, siamo ora scesi a valori di poco superiori all’unità.
Dobbiamo intendere questo come un ulteriore segno che ci stiamo avvicinando (ahimè ancora lentamente, ma con decisione) alla fase di decrescita dell’epidemia.