Qualche giorno fa, noi ricercatori in statistica dell’Università di Milano Bicocca abbiamo cercato di dare un contributo alla nostra Regione sfidando l’aspetto forse più complesso e problematico che il nostro sistema sanitario sta affrontando in queste settimane nella sfida al coronavirus: prevedere nel breve periodo il numero dei pazienti che accederanno alle terapie intensive e, parallelamente, i pazienti che verranno ricoverati in ospedale con sintomi di Covid-19 (utilizzando i dati osservati della protezione civile dal 24 febbraio all’8 marzo). L’esercizio di previsione fornisce un aiuto alla gestione dell’emergenza in corso e alla pianificazione del lavoro incessante – attualmente in atto – di estensione urgente di posti letto per soddisfare il fabbisogno di posti in rianimazione.
Prima dell’emergenza Covid-19 il sistema sanitario lombardo poteva contare su 849 posti letto in terapia intensiva (fonte: ministero della Salute), oggi con uno sforzo senza precedenti la disponibilità di letti è in crescita fino a raggiungere circa 1.200 posti di terapia intensiva.
In queste ore circolano su blog e riviste internazionali tentativi di prevedere come si evolverà il numero di pazienti ricoverati in terapia intensiva per Covid-19.
Un recentissimo articolo dei fratelli Remuzzi del Mario Negri sulla rivista scientifica The Lancet evidenzia come il trend nell’aumento del numero di pazienti che avranno bisogno di terapia intensiva (dati su tutta Italia) aumenterà notevolmente e inesorabilmente nei prossimi giorni, secondo un andamento esponenziale, prevedendo che tale numero potrebbe saturare la capacità del sistema sanitario nazionale entro la metà di aprile 2020 e che saranno necessari fino a 4.000 letti aggiuntivi per poter ricoverare pazienti in terapia intensiva. D’altra parte, confrontando le dinamiche dei contagiati italiani e di quelli della regione di Hubei (Cina), gli autori deducono (o forse sperano) che entro alcuni giorni questo andamento esponenziale del contagio possa rallentare.
Secondo un altro recente studio, pubblicato su Jama da ricercatori del Policlinico di Milano e dell’Istituto Clinico Humanitas, le previsioni del fabbisogno al 20 marzo, effettuate il 7 marzo sui numeri allora disponibili, variano dalle 869, secondo un trend lineare, alle poco più di 1.450, secondo un trend esponenziale.
Altri colleghi universitari statistici e fisici si sono concentrati su problemi simili. I primi stimano una previsione aggregata a livello italiano del numero di “nuovi” contagiati, aspetto forse meno interessante per le autorità sanitarie rispetto al “collo di bottiglia” delle terapie intensive; i secondi stimano un modello esponenziale delle serie interessate nel tempo (le stime sono tuttavia aggiornate solo ai primi di marzo).
L’aspetto interessante è che bene o male gli approcci inerenti la terapia intensiva sono sostanzialmente molto simili: le previsioni sono effettuate con approcci che estrapolano i dati osservati con modelli che oscillano tra un trend lineare/sigmoidale o esponenziale. Tutti sono (e siamo) alla ricerca spasmodica del fatidico giorno di flesso della curva.
In questa nota, vorremmo mostrare come si sono evolute le cose negli ultimi giorni e svelare quale scenario si è mostrato più coerente con i dati più recenti (ad oggi 14 marzo), secondo l’approccio proposto che differisce dalle altre metodologie. Come spiegato nel precedente articolo, ed empiricamente dimostrato, un eventuale legame tra la serie storica principale da prevedere (i pazienti in terapia intensiva) ed altre serie disponibili (i pazienti ricoverati con sintomi) può aiutare il modello a proiettare le dinamiche future.
Nella fattispecie, la forte correlazione temporale (parallelismo o cointegrazione in termini statistici) tra le due serie mostrate in Figura 1, (che mostrano un evidente trend o non stazionarietà), suggerisce l’utilizzo di questa informazione per traslare in avanti nel tempo (previsione o forecast) sia il numero dei pazienti ricoverati in terapia intensiva, sia il numero di pazienti ricoverati con sintomi Covid-19, in un modello bivariato.
A nostro avviso questa informazione è fondamentale e può essere utile per superare il semplicistico esercizio di estrapolazione di un trend di una serie nel tempo, affidandosi di fatto ad una sfera di cristallo, perché nessuno sa come il trend realmente si evolverà (appunto se lineare o esponenziale).
Quindi alla prova dei fatti mostriamo la performance del modello stimato nel presedente articolo a distanza di 5 giorni, valutando in particolare le differenze tra i valori osservati delle due serie nel periodo 9 marzo-13 marzo (dati Protezione civile) e le nostre previsioni (effettuate l’8 marzo per i cinque giorni successivi, come da precedente articolo), per ognuna delle due variabili interessate (Figura 2A e 2B) e per ogni scenario: quello secondo cui la relazione tra le due serie rimarrà stabile (modello ottimistico) e quello secondo cui tale relazione potrà cambiare nel tempo mostrando un trend (modello pessimistico).
L’aspetto più interessante delle Figure 2A e 2B è che fortunatamente l’evoluzione spontanea delle due serie è più simile alla previsione dell’andamento “ottimistico”, forse spiegato dalle misure di contenimento che le autorità hanno attuato in Lombardia a partire dalla fine del mese di febbraio.
Inoltre si conferma il fatto che nel breve periodo il modello “ci prende bene”, mentre è più distante dalla realtà dal quarto giorno in poi (anche se relativamente): a conferma di ciò la figura 2A, mostra una distanza nell’ordine di un centinaio di posti l’ultimo giorno previsto (13 marzo), sottostimati dal nostro modello.
Se questo pattern appare ragionevole (con 14 giorni fare previsioni a 5 è alquanto azzardato), dall’altra si nota in entrambe le Figure 2 un gradino sospetto tra il 10 e l’11 marzo che allontana le previsioni in rosso dalla linea nera osservata. Ricordiamo a tale scopo che al 10 marzo il dato della Lombardia non era completo, come ha sottolineato in conferenza stampa il numero uno della Protezione civile, dott. Angelo Borrelli; probabilmente tali casi sono stati imputati al giorno successivo.
Per concludere, l’analisi che più ci interessa consiste nella “ristima del modello” (l’ultima, ve lo promettiamo!) con i dati fino ad oggi disponibili e una nuova previsione a 4-5 giorni (Figura 3).
Lo scenario prevede un aumento costante, ma contenuto nei prossimi giorni del fabbisogno di posti letto in terapia intensiva con il raggiungimento della soglia di circa 800 pazienti ricoverati, il 19/03. Esattamente la capacità massima lombarda, dichiarata ieri sera in tv dall’assessore alla sanità Giulio Gallera, in diretta nazionale. Si vedrà nei prossimi giorni se tali previsioni saranno smentite dai fatti o da nuovi focolai (ieri Brescia, oggi Bergamo) o meno.
Al di là dei numeri, comunque, l’aspetto forse più attraente di tutta questa situazione è che la comunità scientifica è in grande fermento per studiare sotto ogni profilo il problema che non è di certo solo sanitario, ma anche di natura sociale ed economica, tanto per citare altri aspetti certamente rilevanti. Sono apprezzabili, a nostro avviso, tutti gli sforzi di colleghi, uomini di buona volontà con il desiderio e, forse più di tutto, l’esigenza di sentirsi utili, di divulgare ricerca di buona qualità su un tema così importante, in questo grave momento dove gli atenei sono corridoi vuoti, la didattica è telematica, esami e lauree oscure ombre.
Solo impegnandoci nel nostro piccolo, ma prezioso ambito, citando il nostro Rettore di Bicocca “Raggiungeremo il nostro obiettivo, garantire la salute pubblica e la protezione dei più deboli” e quindi #andràtuttobene (citazione da uno striscione su un balcone).
Piergiorgio.lovaglio@unimib.it, paolo.berta@unimib.it