Zakaj vrednost R-Squared ne pove ničesar o vzročnosti?

Zakaj vrednost R-Squared ne pove ničesar o vzročnosti?
Anonim

Odgovor:

R-kvadrat označuje, kako dobro opazovani podatki ustrezajo pričakovanim podatkom, vendar vam daje samo informacije o korelaciji.

Pojasnilo:

Vrednost R-kvadrate kaže, kako dobro se vaši opazovani podatki ali podatki, ki ste jih zbrali, ujemajo s pričakovanim trendom. Ta vrednost vam pove moč razmerja, vendar, podobno kot pri vseh statističnih testih, ni ničesar, kar bi vam povedalo vzrok za razmerje ali njegovo moč.

V spodnjem primeru lahko vidimo, da graf na levi nima nobene zveze, kot kaže nizka vrednost R na kvadrat. Graf na desni ima zelo močno povezavo, kar kaže na vrednost R na kvadratu 1. V nobenem od teh grafov ne moremo povedati, kaj na koncu povzroča ta odnos.

Korelacija ne pomeni vzročne zveze. Vaše vrednosti X lahko zelo dobro vplivajo na vaše vrednosti Y, drugi dejavniki pa so lahko v igri ali pa je razmerje lahko posledica naključja. Ti lahko sklepati to je vaša razlaga in je ni mogoče dokazati s statističnim testiranjem. Visoka vrednost R-kvadratka vam še vedno pove le moč razmerja, ne pa tudi vzroka.

Dokazovanje vzročnosti je zelo velika naloga. Če želite razumeti vzročnost, je vaša najboljša izbira s poskusi.