Stai leggendo
“In media”, le statistiche possono ingannare?

“In media”, le statistiche possono ingannare?

  • I dati sono fondamentali per decidere
  • Possiamo sempre fidarci dei dati?
  • Una riflessione su medie e mediane
Le statistiche possono ingannare?

Leggo un libro citato in continuazione, e mi viene spontaneo chiedermi: “le statistiche possono ingannare?”

Partiamo dai fatti…

Il libro si chiama Factfulness. In italiano potremmo tradurlo con Fattualità o fedeltà ai fatti.

Il sottotitolo illustra già la tesi di fondo: “Dieci ragioni per cui non capiamo il mondo. E perché le cose vanno meglio di come pensiamo”.

Il mio punto di vista sull’argomento “statistiche” è critico, tuttavia è un libro che ti consiglio, perché sono d’accordo almeno sul punto di partenza: se non ci basiamo sui dati, finiamo per farci trascinare dai nostri errori cognitivi, quelle polarizzazioni (in inglese bias) che ci portano a tirare ogni coperta dove preferiamo.

I fatti producono dati…

Il libro è un’opera postuma di Hans Rosling, medico svedese appassionato di statistiche.

Rosling parte da una serie di questionari somministrati nel corso del tempo a gruppi di persone diversi per dimostrare che le nostre opinioni su molti importanti fenomeni sociali sono sbilanciate verso il negativo, al punto che su ciascuna domanda del questionario un gruppo di macachi genera risposte casuali più accurate.

Paradossalmente Rosling viene accusato del contrario, di essere vittima della Sindrome di Pollyanna, che gli fa vedere solo le tendenze in positivo e trascurare quelle in negativo.

…e dai dati ricaviamo statistiche

Il questionario di Rosling dimostra in maniera evidentissima la sua tesi: interrogati su questioni che vanno dall’istruzione delle bambine alla disponibilità di servizi sanitari di base, sottostimiamo pesantemente le percentuali.

Partendo dalle statistiche, egli dimostra che l’Umanità sta progredendo molto velocemente, che ha poco senso dividerci in Paesi sviluppati e in via di sviluppo, e che la grandissima maggioranza della popolazione mondiale si trova in una fascia media di reddito, correlata ad un valore medio di speranza di vita (che egli considera un importante indicatore del benessere individuale).

Noi tenderemmo a concentrarci sui fenomeni più negativi, senza considerare che coinvolgono pochi Paesi poco abitati.

La Fondazione Gapminder, da lui fondata, offre un bellissimo strumento educativo, Dollar Street, che con migliaia di foto dimostra come gli ambienti di vita si somiglino moltissimo nei diversi Paesi e siano correlati con il reddito: ti consiglio di darci un’occhiata.

Le statistiche possono ingannare?

Dopo tutti questi complimenti, perché sono critico?

Avendo un minimo di conoscenza della realtà, avendo viaggiato molto, i suoi dati non mi sorprendono più di tanto, e quindi posso tentare di scendere ad un ulteriore livello di analisi.

Prima criticità: Rosling ci ricorda più volte come la maggior parte del mondo oggi si trovi al livello della Svezia della sua infanzia (e la Svezia è un Paese “avanzato” da molti punti di vista); perfetto: quindi dobbiamo ritenere un progresso che grossa parte dell’Umanità si trovi oggi al livello al quale stavamo noi 70-80 anni fa, all’uscita della Seconda Guerra Mondiale? e che ci sia ancora un miliardo di persone che vivono con i nostri standard di 100 o 200 anni fa?

Seconda criticità, molto più profonda: possiamo valutare il progresso basandoci sulle medie statistiche?

Mi spiego meglio: se siamo in dieci ed ognuno di noi ha un euro, tranne Donald che ha 100 miliardi di euro, mediamente possediamo circa 10 miliardi di euro a testa; quindi mediamente siamo dei magnati (in altri tempi avremmo nominato il pollo di Trilussa).

Cosa ci inganna di meno?

C’è un altro parametro statistico che è molto più significativo in situazioni di gran disparità: la mediana.

Cos’è la mediana di un insieme? La mediana è il valore che divide l’insieme in due sottoinsiemi uguali, uno con valori maggiori della mediana e uno con valori minori.

Nel nostro esempio, abbiamo 9 persone che hanno 1 euro ed una che ne ha 100 miliardi; la mediana è 1 euro ed è 10 miliardi di volte più piccola della media.

Ho preso un esempio limite, ma per molti insiemi statistici la mediana, che rappresenta molto più fedelmente la “sensazione” media, è molto inferiore alla media. E questo la maggior parte delle statistiche non lo dice.

Facciamo un esempio?

Non sono riuscito a trovare dati sul reddito, ma ho trovato dati sulla ricchezza; semplificando, il reddito è ciò che produciamo in un anno e la ricchezza è l’insieme di ciò che abbiamo, accumulato da noi o lasciatoci in eredità.

La fonte dei dati è pubblica: il Global Wealth Databook prodotto dal Credit Suisse e scaricabile da questa pagina.

Ebbene, a metà 2019 la ricchezza media per adulto sul nostro pianeta era di circa 71.000 dollari, ma la ricchezza mediana era di circa 7.100 dollari, 10 volte di meno.

E l’evoluzione di questi due valori viene mascherata dalla enorme crescita di entrambi in Cina, in cui il rapporto tra i due è inferiore a tre, e dalla buona crescita dell’India, dove il rapporto è inferiore a 5. In termini di statistiche, questi due Paesi rappresentano il 40% della popolazione adulta mondiale, e la loro crescita sostenuta e meno diseguale maschera in parte fenomeni più limitati.

Conclusione?

Non ho una vera e propria conclusione, se non ricordare che i dati sono fondamentali per analizzare qualsiasi fenomeno, come sostiene Factfulness, ma poi abbiamo bisogno di strumenti che ci consentano di interpretarli in maniera corretta, e uno strumento importante è una conoscenza più ampia possibile del mondo attorno a noi e non soltanto le statistiche.

Una postilla attuale ed un appello personale…

Davanti all’epidemia che si sta espandendo in Italia, l’analisi dei numeri ci permette di prevedere cosa succederà se le tendenze attuali rimangono stabili.

Purtroppo ci concentriamo spesso su numeri poco attendibili, perché raccolti con modalità diverse, e questo ci può portare a decisioni sbagliate.

Per esempio dobbiamo considerare che la maggior parte dei dati che abbiamo sono relativi alla Cina e sono stati raccolti con modalità differenti.

Dobbiamo anche considerare che la fetta dominante riguarda una sola Regione della Cina, lo HuBei, che ha una popolazione paragonabile a quella dell’Italia, anche se un po’ più giovane e concentrata nelle città.

Con le misure stringenti lì adottate, l’epidemia ha provocato circa 3000 morti.

Analisi attendibili dei dati ci dicono che oggi siamo più o meno nella stessa situazione in cui era WuHan a fine gennaio, quando la Cina ha messo in campo le misure più restrittive.

Allo stato attuale contagi, ricoveri, morti si moltiplicano per 6 ogni 10 giorni. Se la tendenza rimane questa, i nostri ospedali collasseranno nel giro di un paio di settimane.

Facciamoci un regalo: stiamo a casa. Tutti. Tutte.

#iorestoacasa

Cosa ne pensi?
Bellissimo
0
Interessante
0
Non so
0
Pessimo
0
View Comments (25)
Torna in cima