Assicurazioni - Rivista di diritto, economia e finanza delle assicurazioni privateISSN 0004-511X
G. Giappichelli Editore

indietro

stampa articolo indice fascicolo leggi articolo leggi fascicolo


Somme di ondate logistiche per stimare le durate di Covid-19 in Italia, Stati Uniti e Brasile * (di Emanuele Vannucci,  Università degli Studi di Pisa. Luigi Vannucci, Università degli Studi di Firenze.)


Il contributo tratta dei tentativi di previsione delle durate Covid-19 nel prosieguo dell’emergenza in Italia, Usa, Brasile. Somme di una, due, tre funzioni logistiche sono state adattate ai dati relativi al numero dei decessi giornalieri.

Sums of logistic waves to estimate the durations of Covid-19 in Italy, United States and Brazil

The story of the attempts made for forecasting Covid-19 durations in the continuation of the emergency in Italy, USA, Brazil. Sums of one, two, three logistic functions have been adapted to the data of the daily deaths.

SOMMARIO:

Premessa con la sintesi del percorso metodologico seguito - 1. Epidemie e curve logistiche - 2. Emergenza Covid-19 - 3. Quando Achille raggiunge la tartaruga? - 4. Modello con due ondate logistiche utilizzato dal 17 aprile 2020 e con la sperimentazione fino al 27 aprile 2020 - 5. Confronto tra i due modelli - 6. Ripresa dei lavori con il modello somma di tre ondate logistiche il 13 maggio 2020 - 7. Ripresa dei lavori con il modello a tre ondate logistiche il 3 agosto 2020 - Riferimenti bibliografici


Premessa con la sintesi del percorso metodologico seguito

Questo articolo è stato redatto nel perdurare dell’emergenza Covid-19 in Italia, che all’inizio della emergenza pandemica è stato il Paese che ha avuto il maggior numero di decessi. La premessa intende riassumere i risultati del­l’inseguimento da noi condotto con continuità e perseveranza, allorché ci siamo trovati chiusi in casa da un lockdown rigoroso, di cui volevamo capire la ragione e ... l’incerta durata. Covid-19 ha suscitato subito e continua a suscitare l’interesse e la curiosità di molti studiosi dei vari ambiti di coinvolgimento. Così su di esso si sono via via espressi biologi, virologi, epidemiologi, matematici, statistici... con il quesito ricorrente e direi sovrastante su tutti gli altri di quanto sarebbe durata l’epidemia, considerando le diverse varie aggregazioni territoriali possibili. Anche gli Autori di questa nota a partire dal 21 marzo 2020, incuriositi dal lavoro di Maltagliati M. [1] del 19 marzo 2020, e fino al 15 aprile 2020 hanno cercato di fare previsioni quotidiane sulla durata del Covid-19 in Italia basandosi sul numero giornaliero di decessi comunicati dalla Protezione Civile interpolandoli analiticamente con la funzione logistica (vedi par. 1), minimizzando la somma degli scarti quadratici tra i valori empirici cumulati e quelli ricavati dalla funzione logistica. Ogni giorno si stimavano i tre parametri della logistica, i cui valori non si stabilizzavano: la previsione di fine Covid-19 (vedi par. 2) era il 17 aprile 2020 alla data 21 marzo 2020 e si spostava al 2 maggio 2020 alla data 15 aprile 2020: in 25 giorni la fine Covid-19 incrementava di 15 giorni! La velocità con cui essa progrediva era per fortuna minore di 1, “Achille avrebbe raggiunto la tartaruga” ci siamo detti e l’estrapolazione lineare del 25 aprile 2020 (vedi par. 3) fissò la previsione di fine Covid-19 al 30 maggio 2020. A partire dal 17 aprile 2020 si pensò a un nuovo modello di previsione costituito dalla somma di due logistiche (par. 4). Esso si rilevò subito migliore della singola funzione logistica nell’adattamento ai dati (vedi par. 5). Lo abbiamo sperimentato con i dati dei decessi giornalieri fino al 27 aprile 2020, definendo in tre modi diversi date di fine Covid-19: le tre date, indicanti il giorno in cui dovevano ancora registrarsi 1 (h1), 10 (h10), 100 (h100) decessi. Al 27 aprile 2020, erano rispettivamente [continua ..]


1. Epidemie e curve logistiche

È ben noto che molte epidemie ex post possono essere rappresentate con la funzione logistica Maltagliati M. [1] o con somme di due logistiche Lavrova A. I. et al. [2]: per dovere di cronaca, quest’ultimo è stato da noi intercettato quando ormai stavamo utilizzando il modello con somma di tre logistiche. Le curve logistiche sono utilizzate in numerosissime applicazioni e anche recentemente in ambito finanziario-assicurativo, Baione F. et al. [3] hanno fatto uso di somme di due logistiche per spiegare l’intensità con cui gli assicurati possono riscattare polizze vita. In ambito epidemico queste funzioni hanno come variabile indipendente il tempo, spesso con il giorno quale unità di misura, e come variabile dipendente il numero cumulato di contagiati o di guariti o di ospedalizzati o di decessi... alle varie date. Ex post, a epidemia conclusa, avendo a disposizione i dati giornalieri è un banale problema l’interpolazione dei dati con la “miglior” funzione della fa­miglia di funzioni prese in considerazione: si impone la minimizzazione della somma dei quadrati degli scarti tra i dati empirici e i valori letti sulla funzione interpolante, ottenendo in modo univoco i valori da dare ai parametri per individuare la miglior funzione di interpolazione e da questi valori ricavare poi indicatori di sintesi caratterizzanti la epidemia. Se si assume di ricercare la migliore funzione interpolante nella famiglia delle funzioni logistiche allora si deve considerare la in cui sono presenti tre parametri reali positivi a, b, c, con t il tempo, si supponga misurato in giorni, e con f(t) il numero dei decessi (ma potrebbe essere quello dei contagiati o di guariti o di ospedalizzati ...) fino all’epoca t. Si osservi che si ha f(t) = c – f (2b – t) da cui si segue che il numero di decessi, associati a due intervalli di ugual lunghezza e in simmetria con l’asse t = b, è lo stesso. La derivata, ricordando l’equazione differenziale che caratterizza la funzione logistica è Essa verifica altresì f ‘(t) = f ‘(2b – t) L ‘intensità di morte, se p è il numero totale dei membri della popolazione in cui si accende l’epidemia, è data da Curiosamente, se l’epidemia sterminasse l’intera popolazione, quindi con p = c, si avrebbe ovvero l’intensità di morte sarebbe proporzionale alla [continua ..]


2. Emergenza Covid-19

L’emergenza Covid-19, che ci ha cambiato le abitudini e i modi di vivere in questo anno 2020, è sorta come epidemia nella città di Wuhan in Cina, ma è poi diventata una pandemia interessando le popolazioni dell’intero Pianeta. Covid-19 ha spinto gente curiosa, di ogni ambito scientifico e non solo degli addetti ai lavori, a fare previsioni sulla sua durata per varie aggregazio­ni territoriali, per età, per sesso ... nel perdurare dell’epidemia senza aspettarne la fine anche per motivi di organizzazione e adeguamento del sistema e delle strutture sanitarie, nonché per gli effetti squilibranti i sistemi economico-sociali. Noi abbiamo lavorato a partire dal 21 marzo 2020, giorno 25, con i dati giornalieri dei decessi in Italia. Abbiamo inizialmente previsto un’unica ondata di Covid-19 inseguendo con la funzione logistica non ex post ma giorno dopo giorno le caratteristiche della pandemia in Italia. Abbiamo quindi ristimato ogni giorno a partire dal 21 marzo 2020 la logistica che meglio si adattava tenendo conto del numero quotidiano di decessi, yh, che la protezione civile comunicava ogni giorno intorno alle ore 18: l’algoritmo che abbiamo scritto trova rapidamente il minimo della funzione obiettivo, che è la somma dei quadrati degli scarti tra i dati empirici e i valori letti sulla funzione interpolante Queste, in Tabella 1, sono le risultanze dal 21 marzo 2020 al 15 aprile 2020. Tabella 1 – Stima della dinamica dei parametri della funzione logistica per la previsione della data di fine Covid-19 in Italia   data stima a b c fine [continua ..]


3. Quando Achille raggiunge la tartaruga?

Questo paragrafo scritto a metà aprile rappresentava il tentativo di catturare la dinamica delle stime dei parametri a, b, c per capire se tendevano ad avvicinarsi a valori tendenziali. Per dare un metodo per calcolare il vero fine emergenza Covid-19, ovvero quando Achille raggiungerà la tartaruga si è proceduto basandosi sulle stime di b sopra riportate in terza colonna Tabella 1. Mediante interpolazione lineare, sempre basata sulla minimizzazione di somme di scarti quadratici. Ogni giorno, indicato con = 27, 28, …, 50 (quindi con almeno tre dati di b già calcolati, poiché il primo dato è quello relativo al giorno 25) si sono stimate la pendenza m( ) e l’intercetta q( ) delle 24 = 50 – 27 + 1 rette interpolanti. Questo consente di estrapolare in ogni la stima di b( ,t) (con ovvia interpretazione) per un qualsiasi t con la funzione lineare b( ,t) ≡ q( ) + m( ) t Quindi, ricordando il significato del parametro b (b è la emi-durata del­l’epidemia e 2b è il giorno in cui termina se l’origine dell’epidemia è posta in 0), il giorno di fine emergenza Covid-19 stimata con i dati giornalieri di decessi fino a t deve verificare l’equazione 2b( ,t) ≡ t ovvero 2 (q( ) + m( ) t) = t con soluzione Si riportano nella Tabella 2 i valori della pendenza, m( ), e del termine noto, q( ), delle rette d’interpolazione dei valori di b stimati dal giorno 27 (23 marzo) al giorno 50 (15 aprile), nonché il giorno finale dell’emergenza e la data corrispondente.     Tabella 2 – Estrapolazione lineare per la successione delle stime del parametro b   data stima m( ) q( ) tsol data corrispondente a [continua ..]


4. Modello con due ondate logistiche utilizzato dal 17 aprile 2020 e con la sperimentazione fino al 27 aprile 2020

Visto che l’estrapolazione del parametro b con il modello con una sola ondata conduce molto in là la previsione della fine Covid-19, abbiamo considerato se indicazioni concordanti con queste si avrebbero con il modello con m = 2 ondate, che consentirebbe di ottenere anche altre utili indicazioni. Il modello considerato è ora caratterizzato dai cinque parametri a, b1, b2, c1, c2. Trattandosi della stessa epidemia sulle due ondate si è lasciato un unico parametro a e si sono distinti per le due ondate i giorni di picco, b1 e b2, e i decessi totali nei due focolai, rispettivamente c1 e c2. La funzione obiettivo da minimizzare diventa ora ovvero la somma dei quadrati degli scarti tra i dati empirici yh (il cumulo dei decessi registrati fino al giorno h) e i valori ricavati per interpolazione, . L’algoritmo di minimizzazione è un po’ più complicato ma cattura la (unica) soluzione minimizzante con qualunque precisione desiderata controllando sia il valore della funzione obiettivo che quello delle 5 derivate parziali di : la procedura è snellita per il fatto che i valori di c1 e c2 minimizzanti sono determinati con formula chiusa, condizionatamente ai valori degli altri tre parametri. Si limita di seguito la presentazione dei risultati con il modello a due ondate logistiche, in Tabella 3, ottenuti nei giorni = 50, 51, …, 62 con tre diverse nuove proposte di stima della data di fine Covid-19 in Italia, in Tabella 4. Tabella 3 – Stima della dinamica dei parametri della somma di due logistiche   data stima a b1 b2 c1 c2 c1 + [continua ..]


5. Confronto tra i due modelli

I due modelli ideati hanno utilizzato e continuano a utilizzare come unici dati empirici quelli della serie storica del numero dei decessi quotidiani in Italia nel perdurare dell’emergenza Covid-19. Si sono prima adattati i valori dei tre parametri a, b, c del modello con unica ondata e dal 17 aprile i cinque parametri a, b1, b2, c1, c2 del secondo modello con due ondate logistiche. Questo ormai si impone poiché il crescere anomalo del minimo della funzione obiettivo utilizzando il modello con la funzione logistica faceva intravedere che non ce l’avrebbe fatta a convergere significativamente su quello che si stava osservando. Si segnala solo che con il secondo modello i minimi della funzione obiettivo, 476508,47 il giorno = 53 e 698287,28 il giorno = 62, rappresentano quote esigue di quelli ottenibili con il primo modello: per esempio con la funzione logistica già per = 50 il minimo, 4559933,48, che si poteva ottenere era circa 9,57 volte il minimo del giorno = 53 e 6,53 volte il minimo del giorno = 62. Una curiosità che ci siamo tolti è stata quella di impiegare il modello a due ondate logistiche con i primi dati della serie storica per vedere da quale giorno si poteva già prevedere l’accendersi di una nuova significativa ondata logistica. Citiamo per esempio che già in = 38, il 03-apr, le stime avrebbero dato per il modello a 2 ondate logistiche a = 0,237647, b1 = 24,4762, b2 = 34,7062, c1 = 11634, c2 = 6920, c1 + c2 = 18554 per quello a 1ondata logistica a = 0,186626, b = 30,9012, c = 18297 con il rapporto dei due minimi delle funzioni obiettivo verificante Sarà adeguato questo modello con due ondate logistiche? Il 4 maggio è previsto In Italia un primo allentamento delle rigidità imposte alla nostra vita dall’emergenza Covid-19! Si tornerà anche fuori casa cercando di riprendere vecchie abitudini e modi di vivere: diminuirà così la disponibilità di tempo per noi da mettere a disposizione per indagini come questa, condotta fin qui con pazienza e scrupolo, sperando che la situazione evolva al meglio e non ci costringa ad aggiornarsi.


6. Ripresa dei lavori con il modello somma di tre ondate logistiche il 13 maggio 2020

Speravamo di non doverci riaggiornare, ma la coda dei morti giornalieri stimati con la somma di due logistiche dopo il 70° giorno, 5 maggio 2020, sta sistematicamente sotto i dati empirici dei decessi giornalieri registrati. Ci siamo così decisi a introdurre la terza ondata di contagio da Covid-19 in Italia. Abbiamo ancora optato per un unico valore del parametro a e così i parametri per gestire l’interpolazione sono diventati sette a, b1, b2, b3, c1, c2, c3 La funzione interpolante è pertanto la somma di tre funzioni logistiche La funzione obiettivo da minimizzare è ora ovvero la somma dei quadrati degli scarti tra i dati empirici yh (il cumulo dei decessi registrati fino al giorno h) e i valori g3(h) determinati in funzione dei i valori dei 7 parametri . L’algoritmo di minimizzazione è ancora più complicato, ma si riesce a catturare l’unica soluzione minimizzante con qualunque precisione desiderata controllando sia il valore della funzione obiettivo che quello delle 7 derivate parziali di : la procedura è snellita per il fatto che anche in questo caso i valori di minimizzanti sono determinati con formula chiusa, condizionatamente ai valori degli altri quattro parametri. Per non appesantire ulteriormente il racconto di questa lunga storia, ci si limita di seguito, in Tabella 5 e in Tabella 6, a presentare i risultati. Con il modello a tre ondate logistiche per i soli due giorni = 78 (13 maggio) e = 82 (17 maggio) si ha: Tabella 5 – Stima dei parametri della somma di tre logistiche del 13 maggio e il 17 maggio   a b1 b2 b3 c1 c2 c3   Min 78 0,18503 30,6781 50,8774 70,3233 17367 10043 4261 31671 665002,0 82 0,18306 30,8399 51,5550 73,1718 17623 10256 4439 32318 747254,4   Con il modello a due ondate logistiche si sarebbe ottenuto: Tabella 6 – Stima dei parametri della somma di due logistiche del 13 maggio e il 17 maggio   data stima a b1 b2 c1 c2 t. Min 78 13-mag 0,164548 32,3875 56,9332 19931 10624 30555 4041326,9 82 17-mag 0,157947 32,9840 58,7893 20784 10370 31154 6587029,4 con i rapporti dei due minimi della funzione obiettivo [continua ..]


7. Ripresa dei lavori con il modello a tre ondate logistiche il 3 agosto 2020

Il perdurare con notevole intensità di Covid-19 a livello planetario, che non vede più l’Italia in prima linea con i consistenti numeri di decessi registrati fino a tutto il mese di maggio, ci ha spinto a utilizzare il modello a tre ondate logistiche con i dati dei decessi quotidiani fino al 3 agosto 2020 riferendosi non solo all’Italia ma anche agli Stati Uniti e al Brasile. Questi due Paesi sono rispettivamente ai primi due posti in questa tragica classifica relativa al conteggio delle morti per Covid-19 e per essi sono disponibili su https://www.worldometers.info/coronavirus/country/.../ i dati del numero di decessi dall’inizio della pandemia al giorno sopra indicato.   Essi sono per gli Stati Uniti:   [0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,0,5,3,2,1,3,4,3,4,4,8,3,7,10,15,22,26,50,69,70,66,136,181,269,307,360,502,650,502,822,1101,1259,1212,1284,1578,1426,1525,2268,2212,2148,2282,2067,1756,1748,2630,2692, 2255,2598,1923,1597,1980,2749,2411,2402,1993,2113,1172,1404, 2536,2447,2277,1951,1732,1176,1341,2407,2579,2174,1718,1454,1217,1076,1914,1861,1794,1641,1242,884,1019,1584,1434,1438,1324, 1055,627,637,786,1567,1241,1236,1036,652,697,1151,1107,1054, 990,719,385,600,1107,1001,919,803,717,337,434,864,824,761,733, 584,271,372,876,825,659,668,518,287,370,733,683,693,631,270, 268,387,1005,907,975,862,743,386,476,952,1021,979,966,823,420, 539,1185,1230,1192,1162,926,462,597,1330,1465,1465,1458,1123, 467,567,1362,1311]   con il primo morto il 28 febbraio 2020 e, per esempio, con 22 decessi il 16 marzo e 1311 decessi (ultimo dato considerato) il 3 agosto. Essi sono per il Brasile:   [0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,1,3,3,4,7,7,9,12,13,18,15,22,22,27,38,41,82,39,82,41,78,122,134,134,114,72,83, 105,204,225,190,194,220,101,125,154,165,407,357,375,226,272, 520,448,390,509,340,275,318,578,667,600,804,664,467,502,779, 754,835,824,816,485,735,1130,911,1188,966,965,703,806,1027,1148,1067,1180,890,480,732,1232,1269,1492,1008,910,542,813,1185,1300,1261,843,890,598,729,1338,1209,1204,1221,968,601,748,1364,1103,1180,1055,994,555,727,1271,1057,1277,1264,1111,535,656,1312, 1187,1199,1270,968,659,770,1341,1261,1299,1110,885,716,718,1346,1293,1317,1178,1111,556,627,955,1554,1189,1191,1048,514,572]   con il primo morto il 17 marzo 2020 e, per esempio, con 18 decessi il 26 marzo e 572 decessi (ultimo dato considerato) il 3 agosto. Non si riportano i dettagli e ci si limita a [continua ..]


Riferimenti bibliografici