Pagine importanti

domenica 8 febbraio 2015

VLOG 52: Mentire con le statistiche... creative



Tre persone si presentano in ambulatorio, con dolori alle gambe. Cosa può essere?
Tu non mi piacerai: lo so già.
Per lo più il dolore alle gambe è dato da strappo muscolare. Tenere al caldo e a riposo la parte.
[mh!] Statisticamente sì, molto bene.
La mia esperienza è che in più della metà dei casi il dolore è muscolo-scheletrico: dovuto al troppo esercizio.
Il venti percento sono vene varicose dovute alla gravidanza, e quello che resta - in genere - è dovuto a incidenti stradali.
Sono tre persone, vale a dire sei gambe: cioè ne abbiamo tre che corrono, due con un incidente e una che è rimasta incinta.
Benvenuti a bordo viaggiatori: sono Grizzly e questo è Doctor House Medical Division!
... EHM NO! È DIARIO DI VIAGGIO ON THE ROAD!
[♪♫♪]
E vabbè: ridiamoci sopra. La scenetta che ho... uhm... "recitato" è una parola grossa, diciamo "interpretato" all'inizio del vlog è - effettivamente - tratta dall'undicesima puntata della prima stagione del Doctor House. E mi serve come «rampa di lancio» (avrei potuto usare le immagini del Doctor House, ma credo che YouTube non l'avrebbe gradito. E neanche i detentori del Copyright, quindi ho pensato di recitarla, così non ci sono discussioni); vorrei utilizzarla come «rampa di lancio» per l'argomento di oggi, che è la "statistica".
La statistica è una branca della matematica che si occupa di catalogare, enumerare ed organizzare i dati, nello specifico serve - principalmente - per permettere di analizzare un fenomeno all'interno di una «popolazione» e cercare di rendere presente quel fenomeno sul paragone rispetto ad un modello prestabilito.
Ora attenzione: quando io parlo di «popolazione» non mi riferisco a "popolazione umana": una popolazione è un insieme di dati.
Per esempio in passato lavoravo con le telecomunicazioni e con la telefonia: quando ho lasciato l'ambito squisitamente tecnico della telefonia, mi sono occupato - per un po' - anche dell'ambito più che altro commerciale. Ora quando parliamo di traffico telefonico, la «popolazione» è l'insieme delle telefonate fatte, per esempio, in un determinato bimestre. E il modello di riferimento riguarda la tipologia di questo traffico telefonico: se ci sono molte telefonate lunghe, oppure sono molte telefonate brevi, sono poche ma lunghe, o le telefonate sono verso quali direttrici? Più verso la telefonia mobile, più verso la telefonia fissa, più verso un determinato operatore, e via discorrendo. Ora, quando si fa un'analisi del traffico telefonico si tirano fuori delle informazioni statistiche (la media, la devianza, la varianza, lo scarto quadratico medio) per ottenere delle informazioni che vengono utilizzate per rapportare la tipologia del traffico, che è unica per ogni singolo cliente, con un modello rappresentativo di una grande categoria di clienti: chi fa più telefonate verso la telefonia mobile, chi fa più telefonate brevi, eccetera.
Ora, la statistica, come dicevo, è una branca della matematica, e la matematica è una di quelle materie che a molti viene pesantemente indigesta. Ciò nonostante, la statistica che comprende una serie di calcoli abbastanza astrusi e che non si limita a snocciolare delle percentuali, ma anche ad emettere dei grafici, ad emettere dei paragoni, eccetera, viene spesso utilizzata - letteralmente "a sproposito" - per avvalorare delle tesi che decisamente ben poco hanno di effettivamente valido.
Ora, l'esempio più pratico e più esistente nella realtà, sicuramente è quello che ci da il movimento pastafariano, il quale ci dice che l'aumento della temperatura globale, il «riscaldamento globale», è *statisticamente* dimostrato che è causato dalla diminizione nel numero dei pirati (dal 1700~1600 circa fino alla data attuale).
Ed è un gioco statistico molto interessante, perché non solo è basato su dei dati estremamente aleatori (alcune informazioni - come per esempio la quantità di pirati presente nel XX secolo - non si sa bene da dove venga estratta), ma soprattutto dimostra che non sempre incrociando dei dati statistici è possibile ottenere una concatenazione di causa ed effetto.
Perché è evidente: {i dati stacisti... i dati stadaaahlallà! ☺ } i dati statistici ci danno solamente delle informazioni numeriche, sta a noi interpretarle e la "causa ed effetto" non è una situazione correllata semplicemente all'analisi di dati statistici, bensì alla ripetizione di eventuali osservazioni, all'analisi di osservazioni effettuate in entrambe le condizioni indicate...
... mamma mia come sono chiaro, vero? Facciamo un esempio un pochino più pratico: diciamo che io ho inventato un farmaco.
Questo farmaco fa ricrescere i capelli ai calvi (una cosa che, probabilmente, sarebbe da farmi venire - non lo so - il Premio Nobel) e che io dichiaro che questo farmaco ha successo in oltre il 70% dei casi analizzati e prevede una ricrescita di oltre il 50% dei bulbi piliferi non più esistenti.
Ora: queste due informazioni cosa significano? Significano che io ho questo grafico statistico "persone calve che utilizzano altri farmaci", "persone calve che utilizzano il mio farmaco" e io vedo che chi utilizza il mio farmaco ha il 70% di persone in più (rispetto a chi utilizza prodotti concorrenti) che ottiene una ricrescita dei capelli.
E come si fa a determinare questo? Guardando i grafici? Eh no... eh no: sarebbe bello, ma non è così. Si fa quella che si chiama «analisi in doppio cieco»: si prendono duecento persone (calve, possibilmente); a cento si da un placebo, o un prodotto della concorrenza, o non gli si da nulla. Molto probabilmente si fanno dei test multipli in cui si da a qualcuno dello zucchero, a qualcuno il prodotto della concorrenza... a gruppi di cento.
Cento persone non pigliano niente, cento persone prendono lo zucchero, cento prendono un prodotto della concorrenza, cento prendono la mia pillola.
Alla fine del ciclo di cura, di terapia, che durerà - non so - un mese, si analizzano le cento persone che non hanno preso niente come va la situazione sui loro capelli, le cento persone che hanno preso lo zucchero (il placebo) come va la situazione sui loro capelli, le cento persone che hanno preso il prodotto concorrente come va la situazione, e le cento persone che hanno preso il mio prodotto come va la situazione.
Se rispetto al prodotto concorrente (ci sono due persone su cento che hanno ottenuto una minima ricrescita) e nel caso delle persone che hanno preso il mio prodotto ci sono settantadue persone che hanno ottenuto una ricrescita, allora si definisce che è vero che il 70% dei casi in più, rispetto ai prodotti della concorrenza, funziona.
Poi si analizza - a questo punto - il numero di capelli che sono ricresciuti. Se effettivamente c'è un 50% di ricrescita in più dei bulbi piliferi vuol dire che rispetto ai prodotti della concorrenza, sono cresciuti "molti capelli in più"? No.
Rispetto ai prodotti della concorrenza... vediamo un po' i prodotti della concorrenza: le persone che hanno avuto una ricrescita gli sono cresciuti DUE capelli.
Alle persone che hanno preso il mio farmaco ne sono cresciuti quattro.
Anzi: diciamo CINQUE! C'hanno 5 peli in più sulla capoccia! Virtualmente il mio prodotto ha fatto crescere nel 70% di persone il 50% di capelli in più!
Vedete come...? Grandi cifre: il *cinquanta percento*! Che tutti sanno che è la metà. Il *settanta percento*! Che tutti sanno che è un bel po' più della metà.
E quindi concludo questo vlog, molto veloce, parlandovi di un libro di Darrell Huff intitolato "Mentire con le statistiche", che è un libro molto gradevole, che vi consiglio di acquistarlo se lo trovate da qualche parte (vi metto sul doobly-doo il link per comprarlo su amazon), e vi consiglio di leggerlo perché è molto leggero, ma è molto illuminante e aiuta soprattutto a evitare di diffondere una grandissima quantità di fesserie e bufale che sono surrogate e supportate da una statistica estremamente creativa, e che girano ormai al giorno d'oggi su internet (su facebook, sui social e via discorrendo).
E con questo per oggi è tutto: ragazzi, io come sempre vi ringrazio; vi ricordo - se questo vlog vi è piaciuto o vi è stato utile (o se vi è utile il libro "Mentire con le statistiche") - di fare pollice-in-alto e condividere questo vlog con i vostri amici, sugli altri social network anche, se volete. Vi ricordo, se questo vlog vi è piaciuto e non l'avete già fatto, di iscrivervi al mio canale: è gratuito, e inoltre riceverete una notifica ogni volta che pubblico un nuovo video.
Bene, questo è tutto: noi ci vediamo domenica prossima. Ciao a tutti, e grazie!

Nessun commento:

Posta un commento

Come detto sull'intestazione del Blog, sarete ospiti ben graditi, e per questo vi ringrazio anche per i vostri commenti, anche se messi per criticarmi. (-:
Visto lo spam ricevuto in questo periodo, i commenti sono moderati, pertanto vi prego di utilizzare questo spazio per costruire qualcosa assieme a me e agli altri lettori, astenendovi invece dal limitarvi ad approfittare di questo spazio aperto per fare pubblicità ai vostri prodotti o servizi. In caso di dubbi, in home page trovate il mio indirizzo e-mail e il mio numero di telefono (attivo dal lunedì al venerdì dalle 9 alle 13 e dalle 15 alle 19), per contattarmi.
Infine, vi prego di non utilizzare parolacce, bestemmie o termini che possano urtare la sensibilità mia o dei lettori.
Grazie mille! Grizzly