Enačba za linearno regresijo najmanjših kvadratov:
kje
in
za zbirko
To je grozno vrednotenje (in to je, če to delate ročno); vendar z uporabo računalnika (na primer s preglednico s stolpci:
Obstajajo tri zaporedna pozitivna cela števila, tako da je vsota kvadratov najmanjših dveh 221. Kakšne so številke?
Obstaja 10, 11, 12. Prvo številko lahko imenujemo. Drugo število mora biti zaporedno, tako da bo n + 1, tretje pa n + 2. Pogoj, podan tukaj, je, da kvadrat prve številke n ^ 2 plus kvadrat naslednje številke (n + 1) ^ 2 je 221. Lahko napišemo n ^ 2 + (n + 1) ^ 2 = 221 n ^ 2 + n ^ 2 + 2n + 1 = 221 2n ^ 2 + 2n = 220 n ^ 2 + n = 110 Zdaj imamo dve metodi za reševanje te enačbe. Še ena mehanika, ena bolj umetniška. Mehanika je rešiti enačbo drugega reda n ^ 2 + n-110 = 0 z uporabo formule za enačbe drugega reda. Umetniški način je, da napišemo n (n + 1) = 110 in opazimo, da želimo, da je produkt dveh zaporednih številk 110. Ke
Kako ekstrapolirate z uporabo linearne regresijske premice?
Kadar uporabljamo regresijsko linijo za napovedovanje točke, katere x-vrednost je izven območja x-vrednosti podatkov o vadbi, se to imenuje ekstrapolacija. Če želimo (namerno) ekstrapolirati, uporabimo regresijsko linijo za napovedovanje vrednosti, ki so daleč od podatkov o usposabljanju. Upoštevajte, da ekstrapolacija ne daje zanesljivih napovedi, ker regresijska črta morda ni veljavna zunaj obsega podatkov o usposabljanju.
Zakaj se metoda običajnih najmanjših kvadratov uporablja v linearni regresiji?
Če predpostavke Gauss-Markof držijo, potem OLS zagotavlja najnižjo standardno napako katerega koli linearnega ocenjevalnika, tako da je najboljši linearni nepristranski ocenjevalec Glede na te predpostavke so koeficienti parametrov linearni, to samo pomeni, da sta beta_0 in beta_1 linearni, vendar x nima spremenljivke Da bi bili linearni, je lahko x ^ 2 Podatki so bili vzeti iz naključnega vzorca Ni popolne multi-kolinearnosti, zato dve spremenljivki nista popolnoma povezani. E (u / x_j) = 0 srednja pogojna predpostavka je nič, kar pomeni, da spremenljivke x_j ne dajejo informacij o srednji vrednosti neopazovanih spremenlj