lunedì 9 dicembre 2019

IL NEMICO DELLA CONOSCENZA TUTTO E' CORRELATO +hl Why Correlation Usually ≠ Causation

https://feedly.com/i/entry//cnXVr/5HNe2pDqTI3udBeVx4AbJSW9TNhacAl8h6Dc=_16eea86aae7:a7b4d1:ef2b5e62

IL NEMICO DELLA CONOSCENZA
Il nemico della conoscenza non è l'ignoranza ma la conoscenza casuale, ovvero la credenza di conoscere solo perché si sa prevedere.
La congettura sarebbe questa: in una rete causale in espansione il numero delle possibili correlazioni cresce più velocemente del numero delle relazioni causali.
Bene, ciò significa che ben presto tutto è correlato. Non trovi una relazione tra la variabile A e la variabile B? Raccogli più dati e la troverai.
Quando il sistema sarà abbastanza complesso il rapporto tra nessi causali e correlazioni diventa infinitesimale e a noi non resta che una conoscenza casuale.
Ma a questo punto cosa significa che due variabili sono correlate tra loro? Trovare una correlazione non ha più senso laddove tutto è correlato.
GWERN.NET
Correlations are oft interpreted as evidence for causation; this is oft falsified; do causal graphs explain why this is so common, because the number of possible indirect paths greatly exceeds the direct paths necessary for useful manipulation?

TUTTO E' CORRELATO CON TUTTO
La correlazione non è causalità. Fin qui ci siamo?
Certo che ricordarlo a un economista è come ricordare a un chirurgo di lavarsi le mani prima di operare.
Eppure bisogna farlo. Le false correlazioni imperversano oggi più che mai. La "crisi delle repliche" è stata uno tsunami per le scienze umane; una frazione enorme della ricerca in psicologica e non solo è risultata fallata e impossibile da replicare. Le ipotesi fatte di questa debacle sono sempre le stesse: basso potere statistico, manomissioni, campioni troppo ridotti o selezionati male, correlazioni spurie, bias nella pubblicazione e altre fonti di errore sistematico.
Ma come mai tanta insistenza nel medesimo errore? No, le solite spiegazioni non bastano.
Ipotesi aggiuntiva: partendo dall'idea che "tutto è correlato con tutto", dietro l'illusione ottica c'è qualcosa che riguarda la natura stessa della realtà. E' probabile che nell'estensione delle reti causali (uno scenario che si attaglia alla società moderna)) il numero di possibili correlazioni cresca più velocemente del numero di possibili relazioni causali. Un simile squilibrio spiegherebbe l'eccesso di fiducia.


GWERN.NET
Correlations are oft interpreted as evidence for causation; this is oft falsified; do causal graphs explain why this is so common, because the number of possible indirect paths greatly exceeds the direct paths necessary for useful manipulation?


È risaputo che la correlazione statistica tra due variabili non implica causalità. Nonostante questo ammonimento, anche le persone più avvertite, tendono ad ingannarsi e a rimanere sorprese quando esperimenti più accurati la smentiscono. Penso che l'inganno sia dovuto a un'idea che ho avuto qualche tempo fa sulla natura della realtà. Per questo ho ipotizzato che nelle reti causali realistiche il numero di possibili correlazioni cresca più velocemente del numero di possibili relazioni causali. Un simile squilibrio spiega l'eccesso di fiducia.

Tutto è cominciato con la cosiddetta crisi della replica: una frazione enorme della ricerca psicologica (e non solo) risultava fallata e impossibile da replicare a causa di basso potere statistico, manomissioni, campioni troppo ridotti o selezionati male, correlazioni spurie, parzialità nella pubblicazione e altre fonti di errore sistematico.

Vale la pena di ricordare che in un mondo complesso "tutto è correlato", quindi trovare delle correlazioni è la cosa più facile che ci sia. Quando misuriamo sistematicamente molte variabili su larga scala troviamo correlazioni in abbondanza, anche tra cose che sembrano non avere alcuna relazione causale. Se non riesci a respingere l' "ipotesi nulla" (l'ipotesi secondo cui due fenomeni sono indipendenti), semplicemente non hai ancora raccolto abbastanza dati. Quindi, cosa significa una correlazione tra 2 variabili se sappiamo perfettamente in anticipo che sarà positiva o negativ ma ci sarà? Capita spesso che promettenti correlazioni informino politiche, programmi sociali su istruzione, sanità e economia. L'impatto di questi programmi valutato secono gli strumenti statistici si avvicina sempre allo zero.

Il numero di chiese in una città può essere correlato al numero di bar, ma sappiamo che è perché entrambi sono correlati a quante persone abitano quella città; il numero di pirati può essere inversamente correlato alle temperature globali (ma sappiamo che i pirati non controllano il riscaldamento globale ed è più probabile che qualcosa come lo sviluppo economico porti alla soppressione della pirateria ma anche alle emissioni di CO2); le vendite di gelati possono essere correlate ai morsi di serpente o ai crimini violenti o ai morti per colpi di calore (ma ovviamente i serpenti non si preoccupano di sabotare le vendite di gelati); le persone magre possono avere una postura migliore delle persone grasse, ma stare in piedi non sembra un piano plausibile per perdere peso; indossare indumenti XXXL chiaramente non provoca attacchi di cuore, anche se ci si potrebbe chiedere se la soda dietetica provoca obesità; più vigili del fuoco sono in giro, peggiore è la situafione sul fronte incendi; a giudicare dai voti degli studenti tutorati rispetto a quelli non tutorati, i tutor sembrerebbero dannosi piuttosto che utili; la pelle nera non provoca anemia falciforme né causa vaiolo e malaria; vaccini e autismo sono correlati ma probabilmente cio' è dovuto al fatto che molti vaccini vengono somministrati ai bambini nello stesso momento in cui l'autismo inizierà ad emergere; l'altezza, il lessico utilizzato o le dimensioni del piede e le abilità matematiche possono essere fortemente correlate (nei bambini); il consumo nazionale di cioccolato si correla con i premi Nobel, così come i prestiti bancari e l'affitto di killer. Il consumo moderato di alcol prevede un aumento del reddito; il ruolo delle cicogne nel parto può essere stato sottovalutato; i bambini con alta autostima hanno voti più alti e tassi di criminalità più bassi. In fondo è normale: aumentare l'autostima delle persone ci fa vivere in modo più responsabile e ci tiene lontani da soluzioni criminali. A meno che l'autostima non sia causata da alti voti e successo personale, in questo caso aumentare l'autostima non avrebbe alcun beneficio.



Viviamo in un mondo in cui la ricerca produce molti risultati spuri e, anche quando cerchiamo di distinguere, trovare una correlazione non ha senso perché tutto è correlato fin dall'inizio e, di conseguenza, invalida le nostre scoperte. In campi come medicina, sociologia, economia, psicologia quando chiediamo in che misura le correlazioni predicono esperimenti più affidabili scopriamo che il potere predittivo è scarso. La ricerca correlativa di altissima qualità fatica ancora a sovraperformare il lancio di una moneta nel predire i risultati di un esperimento randomizzato.
aaaaaaaaaaaaaaaaa

Why Correlation Usually ≠ Causation: Causal Nets Cause Common Confounding
Gwern Branwen
Citation (APA): Branwen, G. (2020). Why Correlation Usually ≠ Causation: Causal Nets Cause Common Confounding [Kindle Android version]. Retrieved from Amazon.com

Parte introduttiva
Evidenzia (giallo) - Posizione 2
Why Correlation Usually ≠ Causation: Causal Nets Cause Common Confounding By Gwern Branwen
Nota - Posizione 3
@@@@@@@@ Congettura: quando la complessitá aumenta le correlazioni aumentano più che proporzionalmente rispetto alle cause. Il problema non é non trovare le cause ma credere di averle trovate. Tutto é correlato. Se nn é correlato raccogli piú dati
Evidenzia (giallo) - Posizione 7
I speculate that in realistic causal networks or DAGs, the number of possible correlations grows faster than the number of possible causal relationships.
Nota - Posizione 8
Congettura di fondo
Evidenzia (giallo) - Posizione 8
since people do not think in realistic DAGs but toy models, the imbalance also explains overconfidence.
Nota - Posizione 9
Origini dell ottimismo
Evidenzia (giallo) - Posizione 11
the nature of reality.
Nota - Posizione 11
La congettura é reale.
Evidenzia (giallo) - Posizione 11
evidence from meta-analysis and replication initiatives
Nota - Posizione 11
Bisogna spiegare certi fallimenti teorici....
Evidenzia (giallo) - Posizione 13
and countless failed social engineering attempts.
Nota - Posizione 13
.....e pratici
Evidenzia (giallo) - Posizione 15
The Replication Crisis:
Nota - Posizione 15
Primo concetto
Evidenzia (giallo) - Posizione 21
‘everything is correlated’— even things which seem to have no causal relationship
Evidenzia (giallo) - Posizione 23
If you fail to reject the null hypothesis with p < 0.05, you simply haven’t collected enough data yet.
Nota - Posizione 24
Il trucco
Evidenzia (giallo) - Posizione 24
what does a correlation between 2 variables mean
Nota - Posizione 24
La domanda sorge spontanea
Evidenzia (giallo) - Posizione 26
The Metallic Laws:
Nota - Posizione 26
Terzo concetto
Evidenzia (giallo) - Posizione 26
most efforts to change human behavior and sociology and economics and education fail
Nota - Posizione 27
Tutto torna al suo posto
Evidenzia (giallo) - Posizione 28
Correlation ≠ Causation:
Nota - Posizione 28
Conseguenza
Evidenzia (giallo) - Posizione 29
finding a correlation is meaningless because everything is correlated
Nota - Posizione 30
La triste verit
Evidenzia (giallo) - Posizione 31
when we directly ask how well correlations predict subsequent randomized experiments, we find that the predictive power is poor.
Nota - Posizione 32
Correlazione ed esperimenti
Evidenzia (giallo) - Posizione 33
the highest quality correlational research still struggles to outperform a coin flip
Evidenzia (giallo) - Posizione 36
But why is correlation ≠ causation?
Nota - Posizione 36
Oggi paliamo di questo
Evidenzia (giallo) - Posizione 36
if we write down a causal graph consistent with ‘everything is correlated’
Nota - Posizione 37
Reti causali