Abstract

OBJECTIVES: to identify the Italian provinces with excess mortality during the COVID-19 epidemics using the mortality data provided in April 2020 by the Italian National Institute of Statistics (Istat) that, by design, included only the municipalities with at least 20% mortality increase compared to the same period in 2015-19. Inference with the aim to identify increased mortality at provincial level was a very important task when the Istat data were released in April, but the naïve aggregation of the selected municipalities was not sensible to due to the selection criteria of the municipalities used by Istat.
DESIGN:
use of a permutation-based approach to identify the Italian provinces with excess mortality during the first month of the COVID-19 epidemics using the data made available from Istat and taking into account the biased inclusion criteria.
SETTING AND PARTICIPANTS:
the number of deaths from any cause from 1 January was available for each year of the 2015-2020 period. Data were stratified by municipality, sex and 21 age categories. The third data release (R3) included 1,686 of the 7,904 Italian municipalities with increased mortality in 2020, covering about 40% of the Italian population. Results were compared with those obtainable with the fifth data release (R5), made available in June, when the selection of the municipalities was no longer based on increased mortality and which included more than 90% of the Italian population. R5 was considered the gold standard.
MAIN OUTCOME MEASURES:
excess of deaths from any cause in the Italian provinces between 1 March and 4 April; relative risk (RR); permutation p-values; permutation-based adjusted relative risk; population coverage.
RESULTS:
the results of this study, which are based on two different test statistics, identify 17 and 33 provinces (out of 103) with increased overall mortality, respectively, controlling the family-wise error rate at 0.05 level. Most of the identified provinces are neighbouring provinces in the northern regions of Lombardy, Emilia-Romagna, Piedmont, Liguria, Marche and Tuscany, where most of the COVID-19 cases and deaths were identified. The comparison with data from R5 shows that all the identified provinces had an increase in overall mortality, mostly (31/34) above 25%. On average, the adjusted RR slightly underestimates the RR from R5, underestimating the large RR and overestimating the small RR.
CONCLUSIONS:
this was, to the best of the authors’ knowledge, the first attempt to aggregate the Istat data at province level and obtain a reliable and generalizable statistical inference. This permutation-based approach provides a feasible approach to take into account the selection bias that was present in the data and could be used for analysing other types of data that present some type of selection bias.

 Keywords: COVID-19, Istat, selection bias, mortality, permutation test

Riassunto

OBIETTIVI: identificare le province italiane con eccesso di mortalità durante l’epidemia di COVID-19 usando i dati resi disponibili dall’Istat nel mese di aprile, che includevano solo i comuni per i quali fosse stato riscontrato, a partire dal 1° marzo, un incremento della mortalità pari ad almeno il 20% rispetto al quinquennio precedente. Al rilascio dei dati era molto importante identificare le province con eccesso di mortalità, ma l’inferenza basata sull’aggregazione dei dati a livello provinciale non poteva considerarsi valida.
DISEGNO:
approccio basato sulle permutazioni per identificare le province italiane con eccesso di mortalità durante il primo mese dell’epidemia di COVID-19, usando i dati resi disponibili dall’Istat e tenendo conto dei criteri di selezione dei comuni.
SETTING E PARTECIPANTI:
il numero di decessi per tutte le cause è disponibile dal primo gennaio per gli anni 2015-2020; i dati sono stratificati per comune, sesso e categoria d’età. Il terzo aggiornamento dei dati rilasciato dall’Istat (R3) include 1.686 comuni italiani con eccesso di mortalità e il 40% della popolazione italiana. I risultati sono confrontati con quelli ottenibili per lo stesso periodo con il quinto aggiornamento (R5), reso disponibile a giugno, dove la selezione dei comuni non è basata sull’eccesso di mortalità e che include più del 90% della popolazione italiana. R5 è stato considerato come gold standard.
PRINCIPALI MISURE DI OUTCOME:
eccesso di mortalità nelle province italiane nel periodo tra il 1° marzo e il 4 aprile; rischio relativo (RR); p-value di permutazione; rischio relativo aggiustato; copertura della popolazione.
RISULTATI:
i risultati di questo studio si basano su due statistiche test e identificano, rispettivamente 17 e 33 province (su 103) con eccesso di mortalità, controllando l’errore di primo tipo per la famiglia di test a livello 0,05. La maggior parte delle province è localizzata nelle regioni Lombardia, Emilia-Romagna, Piemonte, Liguria, Marche e Toscana, dove è stato identificato il maggior numero di casi di COVID-19. Il confronto con i dati di R5 dimostra che tutte le province identificate avevano un aumento di mortalità, pari ad almeno il 25% per 31/34 province identificate. Il RR aggiustato diminuisce considerevolmente la distorsione degli RR di R3, in media sottostimando leggermente i RR di R5 (sottostimando i RR elevati e sovrastimando quelli bassi).
CONCLUSIONI:
questo lavoro costituisce, a conoscenza degli autori, il primo tentativo di aggregazione dei dati Istat a livello provinciale con il fine di ottenere un’inferenza valida e generalizzabile. Questo metodo basato sulle permutazioni costituisce un approccio utilizzabile per tenere conto del bias di selezione e può essere utilizzato per altri dati con problemi simili.

 Parole chiave: COVID-19, Istat, bias di selezione, mortalità, test di permutazione

 23/12/2020      Visite