Daily Behaviours & Covid-19:
The impact simulator

Gli algoritmi svelano il diretto impatto del nostro comportamento sulla velocità di contagio

scrolla per continuare

Simulare un'epidemia: COVID-19 e i modelli SIR

Dati, grafici e statistiche stanno invadendo ogni pagina web e post social.

Nelle ultime settimane, inevitabilmente, siamo stati sommersi da nuove informazioni: qualcuna preoccupante, qualcuna incoraggiante ma anche qualcuna incomprensibile.

Trovandosi di fronte - a volte - a statistiche difficilmente interpretabili, si può avere la sensazione di brancolare nel buio. Presto saremo tutti invitati ad abituarci ad una nuova «normalità» , motivo per cui oggi è ancora di più necessario essere consapevoli dell’impatto dei nostri comportamenti.

E cosa - se non i dati – può rappresentare quella scintilla in grado di accendere la luce per garantirci una ripartenza in sicurezza?

Useremo a questo scopo un modello matematico utilizzato in epidemiologia (SIR), applicandolo sui dati reali del Coronavirus in Italia, con un particolare focus sulla Regione Emilia-Romagna. Inoltre, abbiamo sviluppato un simulatore che permette di vedere in che modo l’epidemia dipende dai nostri comportamenti e da alcune misure preventive che siamo chiamati ad applicare.

Distanti ma connessi,
together we spark!

Nice to meet you, SIR

I modelli che possono simulare una epidemia sono molteplici, ma come funzionano? Esso è stato formalizzato da W.O. Kermack e A.G. McKendrick nell’Agosto del 1927 (Approfondisci).

Il modello SIR è un modello compartimentale, ovvero separa la popolazione in insiemi distinti o compartimenti. Parleremo di tre categorie di soggetti:

La maggior parte dei modelli matematici è supportata da una serie di vincoli o assunzioni che vengono fatte sulla realtà analizzata.
Una prima assunzione del modello SIR emerge già nella sua definizione: una volta che un soggetto guarisce dalla malattia, cioè rientra nella categoria R, diventa immune

Questa ed altre assunzioni potrebbero non trovare riscontro nella realtà di oggi. Per questo motivo, non abbiamo l’obiettivo di prevedere esattamente l’andamento del Coronavirus utilizzando il modello SIR.
Stiamo piuttosto cercando di raccontare dei possibili scenari e stimolare delle intuizioni nel lettore in modo da permettergli di avere delle opinioni più consapevoli su quanto sta accadendo.

Il modello SIR, nella sua «semplicità» permette di aumentare la sensibilità riguardo alla velocità di diffusione della malattia e alle sue possibili evoluzioni.

Altre assunzioni del modello SIR:

  • Il saldo della popolazione è stabile. Ovvero non vengono presi in considerazione fenomeni di migrazione e fenomeni demografici (nascite e morti)
  • Non vi è alcun periodo di incubazione: non appena un soggetto viene infettato, può infettare altre persone
  • La popolazione è omogenea ed equamente distribuita nello spazio. Assunzione molto forte in quanto non tiene conto della differenza di distribuzione tra i grandi centri abitati e i piccoli paesi.

Il modello SIR, semplicemente impostando alcuni parametri, permette di calcolare i valori di S, I e R ad un certo momento t.
Questi parametri sono:

  • N: numero di individui nella popolazione
  • Transmission Rate: numero di persone che un soggetto infetto può contagiare in un giorno
  • Recovery Rate: percentuale di infetti che guariscono al giorno

Il numero di riproduzione di base R0, rappresenta il numero di persone medio che una persona infetta è in grado di infettare. Essendo un valore stimato, esistono molteplici formule per calcolarlo, dunque esso può mutare a seconda del modello utilizzato e a seconda delle caratteristiche della popolazione analizzata.

Infatti, non è da sottovalutare l’importanza del grado di stabilità della popolazione per il calcolo di stime affidabili. Un caso celebre, che viene utilizzato come benchmark per il calcolo dell’R0 è quello della Diamond Princess. Una nave da crociera rappresenta una popolazione ideale per l’applicazione di un modello epidemiologico, permettendo di rappresentare con più accuratezza lo sviluppo del patogeno tra i passeggeri della nave.

All’interno del modello SIR, questo numero viene calcolato come: $$R_0 = {Transmission \ rate \over Recovery \ rate}$$

scrolla per continuare
Abbiamo utilizzato una mappa coropletica per rappresentare le differenze in termini di letalità tra le varie regioni italiane. In particolare la percentuale di letalità mostrata è stata ottenuta rapportando il numero di decessi con il numero di casi confermati.​

Applicare SIR al COVID-19

Per dare una dimostrazione dell’applicazione di un modello SIR, abbiamo deciso di applicarlo alla regione Emilia-Romagna sul periodo precedente al lock-down del 09 Marzo 2020.

Il perimetro scelto è quello che più si avvicina alle ipotesi alla base del modello SIR: dopo il lockdown si perde definitivamente il concetto di popolazione equamente distribuita quindi il modello risulterebbe veramente poco accurato. Fissando N come il numero di residenti in Emilia-Romagna, abbiamo stimato il Trasmission Rate (numero di persone che un soggetto infetto può contagiare in un giorno) e il Recovery Rate (percentuale di infetti che guariscono al giorno) applicando un processo Total Data-Driven . Testando su più di 4.000 modelli diversi con diverse combinazioni di parametri, abbiamo individuato il modello che riduce al minimo la differenza tra i dati rilevati e i dati previsti dal modello. La metrica utilizzata per individuare il modello migliore è il Root Mean Square Error (RMSE), una misura di errore tra i valori rilevati e i valori previsti dal modello. Esso si calcola come:

$$RMSE = \sqrt { \sum_{i=1}^{n} {(\hat y_i - y_i)^2 \over n}} $$

In sostanza, tratta di una media delle differenze tra i risultati del modello e i valori reali, effettivamente registrati. Notare che gli errori vengono elevati al quadrato per evitare che valori positivi e negativi possano annullarsi l'uno con l'altro. Con questa misura, inoltre, gli errori di valore maggiore vengono amplificati, caratteristica che privilegia l’individuazione di modelli che minimizzano gli errori di valore maggiore.

Non tutti i modelli sono facilmente comprensibili come il SIR. Algoritmi più complessi (come SIS, SEIR, SEIS, SIDARTHE), eliminando o allentando alcune forti assunzioni del modello SIR, riescono ad adattarsi maggiormente alla realtà. Per esempio, alcuni modelli permettono di considerare i periodi di incubazione di un patogeno oppure altri permettono di considerare eventuali restrizioni come l’isolamento.

Stiamo affrontando una patologia estremamente virale. Registrare un R0 di 2.8, facendo un rapido calcolo, significa che 3 persone ne contagiano 8, che ne contagiano a loro volta 22, che ne contagiano a loro volta altre 61 e così via.

Proiettando le nostre stime fino a inizio giugno, è emerso che avremmo potuto raggiungere più di 1M di infetti entro la prima metà di Aprile. Questa è una stima approssimata ma aiuta a dedurre l’elevata portata che il COVID19 avrebbe potuto assumere.

Le restrizioni emanate hanno permesso di ridurre significativamente il fattore R0 rallentando di conseguenza l’impatto della pandemia. Ma è comunque necessaria la cooperazione di tutti affinché si ottengano gli effetti attesi.

È molto importante ridurre il fattore R0 rispettando le indicazioni diffuse in questi giorni:

  • Isolamento, ovvero rimanere per quanto possibile nella propria abitazione
  • Distanziamento, mantenendo la distanza di sicurezza in presenza di altre persone​
  • Igiene

Attraverso lo sviluppo di un simulatore, è qui possibile sperimentare direttamente come i nostri comportamenti quotidiani possano influenzare l’R0 e di conseguenza ridurre la velocità del contagio.

scrolla per continuare
Prova a modificare gli slider sotto al grafico per vedere come questo cambi in base alle scelte compiute dalla popolazione.

Isolamento

Distanziamento

Igiene

L’enorme impatto delle piccole scelte quotidiane Applicare SIR al COVID-19

Mentre non abbiamo la possibilità di agire sul Recovery Rate, le nostre azioni influenzano sensibilmente il tasso di trasmissione. Se l’intera popolazione adottasse le direttive del governo la velocità di diffusione del contagio diminuirebbe sensibilmente evitando, per quanto possibile, sovraffollamenti al sistema sanitario nazionale.

Interagendo con il grafico seguente diventa evidente la differenza nella crescita delle curve che si ottengono impostando i valori di Isolamento, Distanziamento e Igiene al minimo, rispetto a quelle ottenute supponendo una situazione come quella attuale, in cui si cerca di stare tutti a casa e all’esterno si rispettano le norme igieniche e le distanze di sicurezza

Prova anche tu!

Vuoi saperne di più?
Clicca qui