Hvorfor indikerer ikke en R-kvadrert verdi noe om årsakssammenheng?

Hvorfor indikerer ikke en R-kvadrert verdi noe om årsakssammenheng?
Anonim

Svar:

En R-kvadrat indikerer hvor godt de observerte dataene passer til de forventede dataene, men det gir deg kun informasjon om korrelasjon.

Forklaring:

En R-kvadrat-verdi angir hvor godt dine observerte data, eller dataene du samler, passer til en forventet trend. Denne verdien forteller deg styrken av forholdet, men som alle statistiske tester, er det ingenting gitt som forteller deg årsaken bak forholdet eller dets styrke.

I eksemplet nedenfor kan vi se grafen til venstre har ingen sammenheng, som angitt med lav R-kvadrert verdi. Grafen til høyre har et veldig sterkt forhold, som indikerer med R-kvadratverdien på 1. I ingen av disse grafer kan vi fortelle hva som i siste instans forårsaker dette forholdet.

Korrelasjon betyr ikke årsakssammenheng. Dine X-verdier kan meget godt påvirke Y-verdiene, men andre faktorer kan være i spill eller forholdet kan skyldes tilfeldighet. Du kan antyde årsak, men dette er din tolkning, og det kan ikke bevises ved statistisk testing. Å ha en høy R-kvadrert verdi forteller deg bare styrken av forholdet, men ikke årsaken.

Å bevise årsakssammenheng er en veldig stor oppgave. Hvis du vil forstå årsakssammenheng, er din beste innsats gjennom eksperimenter.