Kako izvedem linearno regresijo na podatkih?

Kako izvedem linearno regresijo na podatkih?
Anonim

Odgovor:

Za razumevanje morate videti celoten odgovor

Pojasnilo:

Ne vem v celoti, kaj misliš, prvič, ko dobiš podatkovni niz, kjer si regres y na x ugotovil, kako sprememba x učinki y.

x y

1 4

2 6

3 7

4 6

5 2

In želite najti odnos med x in y, tako da pravite, da je model podoben

# y = mx + c #

ali v statistiki

# y = beta_0 + beta_1x + u #

teh # beta_0, beta_1 # so parametri v populaciji in. t # u # je učinek neopazovanih spremenljivk, ki se sicer imenujejo izraz napake, tako da želite ocene # hatbeta_0, hatbeta_1 #

Torej # haty = hatbeta_0 + hatbeta_1x #

To vam pove, da vam bodo napovedani koeficienti dali napovedano vrednost y.

Torej zdaj želite najti najboljše ocene za te koeficiente, to naredimo tako, da najdemo najnižjo razliko med dejansko vrednostjo y in predvideno.

#min sum_ (i = 1) ^ nhatu_i ^ 2 ~ hatbeta_0, hatbeta_1 #

To v bistvu pravi, da želite najmanjšo vsoto razlik med akutalnimi y vrednostmi in napovedanimi y vrednostmi za vašo regresijsko premico

Torej so formule za njihovo iskanje

# hatbeta_1 = (sum_ (i = 1) ^ n (x_i- barx) (y_i-bary)) / (sum_ (i = 1) ^ n (x_i-barx) ^ 2) #

# hatbeta_0 = bary-hatbeta_1barx #