Kaj je osrednji mejni izrek?

Kaj je osrednji mejni izrek?
Anonim

Odgovor:

Osrednji mejni izrek narekuje strogo intuitivno idejo, da se ocene srednje vrednosti (ocenjene iz nekega vzorca) nekaterih meritev, povezanih z nekaterimi populacijami, izboljšajo, ko se velikost vzorca poveča.

Pojasnilo:

Predstavljajte si gozd, ki vsebuje 100 dreves.

Zdaj pa si zamislite, da (dokaj nerealno) merimo v metrih, ena četrtina ima višino 2, četrtina jih ima višino 3, četrtina jih ima višino 4, in četrtina jih ima t višina 5.

Predstavljajte si, da merite višino vsakega drevesa v gozdu in uporabite informacije za izdelavo histograma z ustrezno izbranimi velikostmi zabojev (npr. 1,5 do 2,5, 2,5 do 3,5, 3,5 do 4,5 in 5,5 do 6,5; vem, da nisem določil zaboj, ki mu pripadajo meje, vendar tukaj ni pomembno).

Za oceno verjetnostne porazdelitve dreves lahko uporabite histogram. Jasno je, da ne bi bilo normalno.Če bi bile končne točke izbrane ustrezno, bi bilo to enotno, ker bi bilo v vsakem zaboju enako število dreves, ki ustrezajo eni od navedenih višin.

Predstavljajte si, kako greste v gozd in merite višino samo dveh dreves; izračunajte srednjo višino teh dveh dreves in si jo zabeležite. To operacijo ponovite večkrat, tako da boste imeli zbirko srednjih vrednosti za vzorce velikosti 2. Če bi načrtovali histogram ocen srednje vrednosti, ne bi več bil enak. Namesto tega je verjetno, da bi bilo več meritev (ocene povprečja na podlagi vzorcev velikosti 2) blizu celotne srednje višine vseh dreves v gozdu (v tem posebnem primeru,

#(2 + 3 + 4 + 5)/4 = 3.5# metrov).

Kot bi bilo več ocene povprečja blizu dejansko povprečje prebivalstva (kar je znano v tem nerealnem primeru), kot daleč od srednje vrednosti, bi bila oblika tega novega histograma bližja normalni porazdelitvi (z vrhom v bližini srednje vrednosti).

Predstavljajte si, kako greste v gozd in ponovite vajo, razen da merite višino treh dreves, izračunajte srednjo vrednost v vsakem primeru in si jo zabeležite. Histogram, ki bi ga zgradili, bi imel še več ocen povprečja blizu pravega povprečja, z manj širjenjem (možnost izbire treh dreves v katerem koli vzorcu, tako da vsi prihajajo iz ene od končnih skupin --- bodisi samega t visok ali zelo kratek --- je manj kot izbiranje treh dreves z izbiro višin). Oblika vašega histograma, ki vsebuje oceno srednje velikosti (vsaka srednja vrednost, ki temelji na treh meritvah), bi bila bližja normalni porazdelitvi in ustrezni standardni odmik (ocen srednje vrednosti, ne starševske populacije) bi bil manjši.

To ponovite za 4, 5, 6 itd., Drevesa na srednjo vrednost in histogram, ki bi ga zgradili, bi vse bolj izgledal kot normalna porazdelitev (s postopno večjimi velikostmi vzorcev), s srednjo vrednostjo distribucijo ocene povprečja biti bližje resničnemu povprečju in standardni odklon ocen povprečja, ki postaja vse ožji in ožji.

Če ponovite vajo za (degeneriran) primer, v katerem se merijo vsa drevesa (večkrat, zabeležite povprečje v vsakem primeru), bo histogram imel oceno samo v eni od posnetkov. (tista, ki ustreza dejanski srednji vrednosti), brez kakršne koli spremembe, tako da bi bilo standardno odstopanje (porazdelitev verjetnosti, ocenjeno iz), da je "histogram" nič.

Torej osrednji mejni izrek ugotavlja, da se srednja vrednost neke ocene povprečja neke populacije asimptotično približa pravemu povprečju in standardni odklon ocene srednje vrednosti (namesto standardnega odstopanja porazdelitve matične populacije). postaja vedno manjša pri večjih velikostih vzorcev.