Kakšno je razmerje med R-kvadratom in korelacijskim koeficientom modela?

Kakšno je razmerje med R-kvadratom in korelacijskim koeficientom modela?
Anonim

Odgovor:

Poglej to. Zasluge za Gaurav Bansal.

Pojasnilo:

Poskušal sem si zamisliti najboljši način, da to pojasnim, in naletel sem na stran, ki resnično lepo dela. Raje bi temu fantu dala zasluge za razlago. V primeru, da povezava ne deluje za nekatere sem vključil nekaj informacij spodaj.

Preprosto rečeno: # R ^ 2 # vrednost je preprosto kvadrat korelacijskega koeficienta # R #.

The korelacijski koeficient (# R #) modela (npr. s spremenljivkami) # x # in # y #) prevzame vrednosti med #-1# in #1#. Opisuje, kako # x # in # y # so povezane.

  • Če # x # in # y # v popolnem sozvočju, potem bo ta vrednost pozitivna #1#
  • Če # x # se poveča # y # nasprotno se zmanjša, potem bo ta vrednost #-1#
  • #0# bi bila situacija, kjer ni povezave med # x # in # y #

Toda to # R # vrednost je uporabna samo za enostaven linearni model (samo # x # in # y #). Ko enkrat upoštevamo več kot eno neodvisno spremenljivko (zdaj imamo # x_1 #, # x_2 #, …), zelo težko je razumeti, kaj pomeni korelacijski koeficient. Spremljanje, katera spremenljivka prispeva k korelaciji, ni tako jasno.

Tukaj je # R ^ 2 # vrednost. To je preprosto kvadrat korelacijskega koeficienta. Zajema vrednosti med #0# in #1#, kjer so vrednosti blizu. t #1# pomeni večjo korelacijo (bodisi pozitivno ali negativno korelirano) in #0# ne pomeni nobene korelacije. Drug način, kako si ga lahko zamislite, je kot delna variacija v odvisni spremenljivki, ki je rezultat vseh neodvisnih spremenljivk. Če je odvisna spremenljivka zelo odvisna od vseh njenih neodvisnih spremenljivk, bo vrednost blizu #1#. Torej # R ^ 2 # je veliko bolj uporaben, saj ga lahko uporabimo tudi za opis multivariatnih modelov.

Če želite razpravo o nekaterih matematičnih pojmih, ki se nanašajo na povezovanje dveh vrednosti, glej to.