mercoledì 24 marzo 2010

Trappoloni

I tre trappoloni più ricorrenti in cui cade il lettore di statistiche.

1. La "significatività" statistica indica che esiste una probabilità del 5% che la Relazione supposta non esista in presenza dei Dati sperimentali. Il che non significa una probabilità del 95% dell' esistenza di R in presenza di D. Infatti se sposando un non-biondo ho il 5% di possibilità di sposare un uomo intelligente, non significa che sposando un biondo le probabilità di accasarmi con un tipo brillante siano del 95%!**

2. La singola relazione deve essere testata in un modello. Specie nelle scienze sociali i Dati sperimentali sono ballerini e contengono essi stessi numerosi bias. In questo senso la conoscenza è olistica.

3. La lettura dei dati deve essere bayesiana, quasi sempre questo sfugge.

**Consider this simplified example. Suppose a certain dog is known to bark constantly when hungry. But when well-fed, the dog barks less than 5 percent of the time. So if you assume for the null hypothesis that the dog is not hungry, the probability of observing the dog barking (given that hypothesis) is less than 5 percent. If you then actually do observe the dog barking, what is the likelihood that the null hypothesis is incorrect and the dog is in fact hungry?

Answer: That probability cannot be computed with the information given. The dog barks 100 percent of the time when hungry, and less than 5 percent of the time when not hungry. To compute the likelihood of hunger, you need to know how often the dog is fed, information not provided by the mere observation of barking