mercoledì 26 marzo 2008

Dodici illusioni statistiche...sistematiche!

Poichè lo strumento statistico è tra quelli privilegiati attraverso cui realizzare la comunicazione "democratica", e poichè al suo apparire si presenta sempre circonfuso da una certa aurea di autorevolezza, puo' essere prezioso sottolineare alcuni effetti illusionistici che produce comunemente.

Attenzione, non sto parlando di specchietti che attirano soltando le allodole più ingenue, non parlo dei "polli di Trilussa", parlo di errori sistematici che lo strumento statistico/probabilistico induce "naturalmente", quindi anche nell' esperto.


  1. Probabilità a priori degli esiti. Si tende a sottovalutare le frequenze a priori del contesto. Se dico che Tizio è laureato un italiano laureato in medicina, chi ascolta tende a calcolare le probabilità che Tizio sia un medico senza tener conto del numero di medici esistenti in Italia.

  2. Dimensioni del campione. Una volta sicuri che il campione sia perfettamente rappresentativo della popolazione, si tende a trascurare la dimensione dello stesso. Eppure la dimensione continua ad essere enormemente influente sugli scostamenti misurati in percentuali. Le percentuali calcolate su "numeri piccoli" sono molto più ampie rispetto a quelle calcolate su "numeri grandi".

  3. Casualità non rilevata. Tirando al moneta una sequenza CTCTCCTT ci appare come casuale mentre una sequenza CTTTTTTT ci appare come pilotata. Eppure entrambe le sequenze hanno la medesima probabilità estrattiva.

  4. Probabilità delle probabilità. Tendiamo a formulare le nostre previsioni utilizzando delle distribuzioni probabilistiche. Nello stesso tempo siamo portati a non tener conto dell' incertezza con cui sono state costruite quelle medesime distribuzioni. Esempio, una volta fissata una proxy, ci dimentichiamo presto, nel valutare i nostri risultati finali, del margine con cui approssima la variabile reale che ci occorrerebbe.

  5. Regressioni verso la media. E' un fenomeno naturalmente sottostimato. Prendiamo una gara articolata su due manches. I migliori nella prima tornata peggioreranno sicuramente la loro prestazione media nella seconda. Altro esempio, prendiamo delle coppie di coniugi e valutiamo i mariti per la loro preparazione culturale. Isolando i più preparati e passando poi a considerare le mogli ci rendiamo conto che la prestazione di queste ultime non è, nell' insieme relativo alle mogli, all' altezza di quella dei corrispondenti mariti nell' insieme che li riguarda. Ci sorprendiamo di questo fatto nonostante sia del tutto naturale.

  6. Disponibilità. Vengono sopravvalutate le frequenze che saltano più all' occhio nell' esperienza comune. Se leggo un elenco di nominativi contenente parecchie donne famose e poi chiedo se nell' elenco erano più numerose le donne o gli uomini, probabilmente mi verrà risposto che erano più numerose le donne.

  7. Correlazione illusoria. Se nella mia immaginazione penso ossesivamente a due elementi finirò per trovarvi una correlazione anche quando non esiste.

  8. Aggiustamento insufficiente dell' ancoraggio. Se devo produrre una stima partendo da un punto di riferimento mi dimostrerò riluttante a scostarmi eccessivamente da quel punto. Esempio, richiesto di fornire in pochi secondi il seguente prodotto: 8*7*6*5*4*3*2*1, darò un numero più elevato rispetto alla stessa richiesta così formulata: 1*2*3*4*5*6*7*8. Questo perchè comincerò con le prime moltiplicazioni tanto per avere un riferimento, poi mi discosterò intuitivamente da quell' ancoragio.

  9. Eventi congiunti, semplici e disgiunti. Si tende a considerare i primi come più probabili anche se non lo sono. Si tende a considerare i secondi come più probabili dei terzi anche se non lo sono. Evento congiunto: estrarre 7 volte CONSECUTIVAMENTE una pallina rossa da un sacchetto reintegrato che contiene il 90% di palline rosse. Evento semplice: estrarre una pallina rossa da un sacchetto che contiene 50 palline rosse e 50 palline bianche. Evento disgiunto: estrarre ALMENO una pallina rossa su sette tentativi da un sacchetto che contiene il 10% di palline rosse.

  10. Code corte. Nel congetturare una distribuzione probabilistica soggettiva si tende a sottostimare gli eventi eccezionali producendo code corte nella campana gaussiana.

  11. Critica di Lucas. Nelle scienze umane, specie nell' economia, l' individuazione di una regolarità statistica è la premessa affinchè cessi. Almeno se gli operatori sono razionali. Pensate a cosa succederebbe se si scoprisse che le quotazioni di borsa si alzano sempre al Lunedì mattina (vedi Taleb p. 125).

  12. Bias del complotto. Esperimento: poniamo che A dica al CEO B di una multinazionale di avere una grande idea che però comprometterà l' ambiente e il CEO reagisca in questo modo: "dell' ambiente non mi interessa, passiamo subito all' azione". Ora poniamo invece che A dica a B di avere una grande idea che, oltre a fruttare parecchi profitti, giovas all' ambiente. Il CEO reagisce così: dell' ambiente non me ne frega niente, passiamo subito all' azione. Con una strana asimmetria chi guarda alla prima scena giudica B un delinquente mentre nella seconda scena non è affatto disposto a giudicarlo un eroe.



Per la messe di test sperimentali si rinvia al cap.2 di KAHNEMAN EF