Vakiovirhe - Standard error

Arvon osalta, joka on otettu puolueettomalla normaalijakaumavirheellä , edellä on esitetty näytteiden osuus, joka olisi 0, 1, 2 ja 3 keskihajonnan välillä todellisen arvon ylä- ja alapuolella.

Keskivirhe ( SE ), joka on tilastollinen (yleensä estimaatin parametrin ) on keskihajonta sen näytteenottoa jakelu tai arvio, että keskihajonta. Jos tilasto on otoksen keskiarvo, sitä kutsutaan keskiarvon standardivirheeksi ( SEM ).

Näytteenotto jakauma on keskiarvo tuotetaan toistuva näytteenotto samasta populaatiosta ja tallennus näytteen avulla saatuja. Tämä muodostaa jakauman eri keinoille, ja tällä jakaumalla on oma keskiarvonsa ja vaihtelunsa . Matemaattisesti saadun otantajakauman varianssit ovat yhtä suuret kuin populaation varianssit jaettuna otoksen koolla. Tämä johtuu siitä, että otoksen koon kasvaessa otos tarkoittaa klusteria tarkemmin väestön keskiarvon ympärillä.

Siksi keskiarvon keski- virheen ja keskihajonnan välinen suhde on sellainen, että tietyn otoskoon osalta keskiarvon keski- virhe on yhtä suuri kuin keskihajonta jaettuna otoskoon neliöjuurella . Toisin sanoen keskiarvon vakiovirhe on otosvälineiden hajonnan mitta väestön keskiarvon ympärille.

In regressioanalyysi , termi "standardi virhe" viittaa joko neliöjuuri vähennetään khiin neliö , tai standardi virheen tietyn regressiokerroin (kuten käytetään, esimerkiksi, luottamusvälit ).

Keskiarvon vakiovirhe

Tarkka arvo

Jos tilastollisesti riippumaton otos havainnoista otetaan tilastollisesta populaatiosta , jonka keskihajonta on , otoksesta lasketulla keskiarvolla on siihen liittyvä vakiovirhe keskiarvolla, jonka antaa: ${\ displaystyle n}$ ${\ displaystyle x_ {1}, x_ {2}, \ ldots, x_ {n}}$ ${\ displaystyle \ sigma}$ ${\ displaystyle {\ bar {x}}}$ ${\ displaystyle {\ sigma} _ {\ bar {x}}}$

{\ displaystyle {\ sigma} _ {\ bar {x}} \ = {\ frac {\ sigma} {\ sqrt {n}}}}

.

Käytännössä tämä kertoo meille, että kun yritetään arvioida väestön keskiarvon arvoa tekijän vuoksi , estimaatin virheen vähentäminen kertoimella kaksi edellyttää, että otoksessa on hankittu neljä kertaa enemmän havaintoja; sen pienentäminen kymmenkertaiseksi vaatii sata kertaa enemmän havaintoja. ${\ displaystyle 1/{\ sqrt {n}}}$

Arvio

Näytteen otettavan populaation keskihajonta tiedetään harvoin. Näin ollen, standardin keskivirhe on yleensä arvioitu korvaamalla kanssa näytteen keskihajonta sijasta: ${\ displaystyle \ sigma}$ ${\ displaystyle \ sigma}$ ${\ displaystyle \ sigma _ {x}}$

{\ displaystyle {\ sigma} _ {\ bar {x}} \ \ noin {\ frac {\ sigma _ {x}} {\ sqrt {n}}}}

.

Koska tämä on vain arvio "todellisesta" standardivirheestä ", on tavallista nähdä muita merkintöjä, kuten:

{\ displaystyle {\ widehat {\ sigma}} _ {\ bar {x}} = {\ frac {\ sigma _ {x}} {\ sqrt {n}}}}

tai vuorotellen .

{\ displaystyle {s} _ {\ bar {x}} \ = {\ frac {s} {\ sqrt {n}}}}

Yhteinen aiheuttaa sekaannusta tapahtuu, kun se ei ole selvästi erottaa keskihajonta väestöstä ( ), keskihajonta ja näytteen ( ), keskihajonta ja keskiarvo itse ( , joka on standardi virhe), ja estimaattori ja keskiarvon keskihajonta ( joka on useimmin laskettu määrä ja jota kutsutaan usein myös puhekielessä vakiovirheeksi ). ${\ displaystyle \ sigma}$ ${\ displaystyle \ sigma _ {x}}$ ${\ displaystyle \ sigma _ {\ bar {x}}}$ ${\ displaystyle {\ widehat {\ sigma}} _ {\ bar {x}}}$

Arvioijan tarkkuus

Kun otoskoko on pieni, otoksen keskihajonnan käyttäminen populaation todellisen keskihajonnan sijasta pyrkii systemaattisesti aliarvioimaan väestön keskihajonnan ja siten myös standardivirheen. Kun n = 2, aliarviointi on noin 25%, mutta n = 6, aliarviointi on vain 5%. Gurland ja Tripathi (1971) tarjoavat korjauksen ja yhtälön tälle vaikutukselle. Sokal ja Rohlf (1981) antavat yhtälön korjauskertoimesta pienille näytteille, jotka ovat n <20. Katso keskihajonnan puolueeton estimaatti jatkokeskustelua varten.

Johtaminen

Standardi virhe keskiarvosta voi olla peräisin varianssi summan riippumattomien satunnaismuuttujien, koska määritelmän varianssin ja joitakin yksinkertaisia ominaisuuksia sen. Jos ovat riippumattomia havaintoja populaatiosta, jolla on keskiarvo ja keskihajonta , voimme määrittää kokonaismäärän ${\ displaystyle x_ {1}, x_ {2}, \ ldots, x_ {n}}$ ${\ displaystyle n}$ ${\ displaystyle {\ bar {x}}}$ ${\ displaystyle \ sigma}$

{\ displaystyle T = (x_ {1}+x_ {2}+\ cdots+x_ {n})}

joka johtuu Bienaymé kaava , on varianssi

{\ displaystyle \ operaattorinimi {Var} (T) = {\ iso (} \ operaattorinimi {Var} (x_ {1})+\ operaattorinimi {Var} (x_ {2})+\ cdots+\ operaattorinimi {Var} ( x_ {n}) {\ iso)} = n \ sigma ^{2}.}

Näiden mittausten keskiarvo on yksinkertaisesti annettu ${\ displaystyle {\ bar {x}}}$

{\ displaystyle {\ bar {x}} = T/n}

.

Keskiarvon varianssi on silloin

{\ displaystyle \ operaattorinimi {Var} ({\ bar {x}}) = \ operaattorinimi {Var} \ left ({\ frac {T} {n}} \ right) = {\ frac {1} {n^{ 2}}} \ operaattorinimi {Var} (T) = {\ frac {1} {n ^{2}}} n \ sigma ^{2} = {\ frac {\ sigma ^{2}} {n}} .}

Vakiovirhe on määritelmän mukaan, jonka keskihajonta on yksinkertaisesti varianssin neliöjuuri: ${\ displaystyle {\ bar {x}}}$

{\ displaystyle \ sigma _ {\ bar {x}} = {\ sqrt {\ frac {\ sigma ^{2}} {n}}} = {\ frac {\ sigma} {\ sqrt {n}}}}

.

Korreloiduille satunnaismuuttujille otosvarianssi on laskettava Markov -ketjun keskusraja -lauseen mukaisesti .

Riippumattomat ja identtisesti jakautuneet satunnaismuuttujat, joiden otoskoko on satunnainen

On tapauksia, joissa näyte otetaan tietämättä etukäteen, kuinka monta havaintoa hyväksytään jonkin kriteerin mukaan. Tällaisissa tapauksissa otoskoko on satunnaismuuttuja, jonka vaihtelu lisää vaihtelua siten , että ${\ displaystyle N}$ ${\ displaystyle X}$

{\ displaystyle \ operaattorinimi {Var} (T) = \ operaattorinimi {E} (N) \ operaattorinimi {Var} (X)+\ operaattorinimi {Var} (N) {\ iso (} \ operaattorinimi {E} (X) {\ iso)}^{2}}

Jos on Poisson -jakauma , niin estimaattorilla . Näin ollen estimaattori muuttuu , mikä johtaa seuraavaan standardivirheen kaavaan: ${\ displaystyle N}$ ${\ displaystyle \ operaattorinimi {E} (N) = \ operaattorinimi {Var} (N)}$ ${\ displaystyle N = n}$ ${\ displaystyle \ operaattorinimi {Var} (T)}$ ${\ displaystyle nS_ {X}^{2}+n {\ bar {X}}^{2}}$

{\ displaystyle \ operaattorinimi {Vakiovirhe} ({\ bar {X}}) = {\ sqrt {\ frac {S_ {X}^{2}+{\ bar {X}}^{2}} {n }}}}

(koska keskihajonta on varianssin neliöjuuri)

Opiskelija -arvio, kun σ -arvo on tuntematon

Monissa käytännön sovelluksissa σ: n todellinen arvo on tuntematon. Tämän seurauksena meidän on käytettävä jakaumaa, joka ottaa huomioon mahdollisen σ: n hajonnan . Kun todellinen taustalla oleva jakauma tiedetään olevan Gaussin, vaikka tuntematon σ, niin tuloksena oleva arvioitu jakauma seuraa Studentin t-jakaumaa. Vakiovirhe on Studentin t-jakauman keskihajonta. T-jakaumat ovat hieman erilaisia kuin Gaussin ja vaihtelevat otoksen koon mukaan. Pienet näytteet todennäköisesti aliarvioivat väestön keskihajonnan ja niiden keskiarvo eroaa todellisesta väestön keskiarvosta, ja opiskelijoiden t-jakauma vastaa näiden tapahtumien todennäköisyydestä hieman raskaammilla hännillä verrattuna gaussilaiseen. Opiskelijan t-jakauman vakiovirheen arvioimiseksi riittää käyttää näytteen keskihajontaa "s" σ: n sijaan , ja voisimme käyttää tätä arvoa luottamusvälien laskemiseen.

Huomautus: Studentin todennäköisyysjakauma approksimoidaan hyvin Gauss-jakauma, kun näytteen koko on yli 100. Tällaisia näytteitä voidaan käyttää jälkimmäistä jakauma, joka on paljon yksinkertaisempi.

Oletukset ja käyttö

Esimerkki siitä, miten sitä käytetään, on tehdä tuntemattoman väestön luottamusvälien keskiarvo. Jos otantajakauma jakautuu normaalisti , otoskeskiarvoa, vakiovirhettä ja normaalijakauman kvantisileja voidaan käyttää todellisen väestön keskiarvon luottamusvälien laskemiseen. Seuraavat lausekkeet voidaan laskea ylemmän ja alemman 95%: n luotettavuusrajat, jossa on yhtä suuri kuin näytteen keskiarvo, on yhtä suuri kuin keskivirhe näytteen keskiarvo, ja 1,96 on likimääräinen arvo 97,5 prosenttipiste pisteen normaali jakelu : ${\ displaystyle \ operaattorinimi {SE}}$ ${\ displaystyle {\ bar {x}}}$ ${\ displaystyle \ operaattorinimi {SE}}$

Ylempi 95% raja ja

{\ displaystyle = {\ bar {x}}+(\ operaattorinimi {SE} \ kertaa 1.96),}

Alempi 95% raja

{\ displaystyle = {\ bar {x}}-(\ operaattorinimi {SE} \ kertaa 1.96).}

Erityisesti otostilaston (kuten otoksen keskiarvon ) keski- virhe on otoskeskiarvon todellinen tai arvioitu keskihajonta prosessissa, jolla se luotiin. Toisin sanoen, se on todellinen tai arvioitu standardipoikkeama näytteenoton jakelu näytteen tilastollinen. Merkintätapaa varten standardi virhe voi olla mikä tahansa yksi SE, SEM (standardi virhe mittaus tai keskiarvo ), tai S- _E .

Vakiovirheet tarjoavat yksinkertaisia mittauksia epävarmuuteen arvossa, ja niitä käytetään usein, koska:

monissa tapauksissa, jos useiden yksittäisten määrien keski- virhe tiedetään, joidenkin funktioiden vakiovirhe voidaan helposti laskea;
kun arvon todennäköisyysjakauma on tiedossa, sitä voidaan käyttää tarkan luottamusvälin laskemiseen ;
kun todennäköisyysjakauma on tuntematon, Chebyshevin tai Vysochanskiï -Petuninin eriarvoisuutta voidaan käyttää konservatiivisen luottamusvälin laskemiseen; ja
Koska otoskoko on yleensä ääretön, keskusraja -lause takaa, että keskiarvon otosjakauma on asymptoottisesti normaali .

Keskivirheen vakiovirhe keskihajonnan suhteen

Tieteellisessä ja teknisessä kirjallisuudessa kokeelliset tiedot koostuvat usein joko käyttäen otantatietojen keskiarvoa ja keskihajontaa tai keskivirheen keskiarvoa. Tämä johtaa usein sekaannukseen niiden vaihdettavuudesta. Keskiarvo ja keskihajonta ovat kuitenkin kuvailevia tilastoja , kun taas keskiarvon vakiovirhe kuvaa satunnaisotantaprosessia. Otantatietojen keskihajonta on kuvaus mittausten vaihtelusta, kun taas keskiarvon vakiovirhe on todennäköisyyslausunto siitä, miten otoskoko antaa paremman sidoksen populaation keskiarvon arviointiin keskiarvon valossa lause.

Yksinkertaisesti sanottuna otoskeskiarvon vakiovirhe on arvio siitä, kuinka kaukana otoksen keskiarvo todennäköisesti on väestön keskiarvosta, kun taas otoksen keskihajonta on aste, jossa otoksessa olevat yksilöt eroavat otoksen keskiarvosta. Jos väestön keskihajonta on äärellinen, otoksen keskiarvon keskivirhe pyrkii nollaan otoskoon kasvaessa, koska populaation keskiarvon arvio paranee, kun taas otoksen keskihajonnalla on taipumus lähentää väestöstandardia poikkeama otoksen koon kasvaessa.

Laajennukset

Äärellinen populaation korjaus (FPC)

Edellä vakiovirheelle annettu kaava olettaa, että otoskoko on paljon pienempi kuin populaation koko, joten populaation voidaan katsoa olevan loputtoman kokoinen. Näin on yleensä myös rajallisten populaatioiden tapauksessa, koska useimmiten ihmiset ovat ensisijaisesti kiinnostuneita hallitsemaan prosesseja, jotka loivat olemassa olevan rajallisen väestön; Tätä kutsutaan analyyttinen tutkimus , seuraavat W. Edwards Deming . Jos ihmiset ovat kiinnostuneita hallitsemaan olemassa olevaa äärellistä väestöä, joka ei muutu ajan myötä, on tarpeen mukautua populaation kokoon; tätä kutsutaan luetteloivaksi tutkimukseksi .

Kun näytteenotto -osa (jota usein kutsutaan f: ksi ) on suuri (noin 5% tai enemmän) luetteloitavassa tutkimuksessa , vakiovirheen estimaatti on korjattava kertomalla '' äärellinen populaatiokorjaus '' (alias: fpc ):

{\ displaystyle \ operaattorinimi {FPC} = {\ sqrt {\ frac {Nn} {N-1}}}

mikä suurelle N : lle:

{\ displaystyle \ operaattorinimi {FPC} \ noin {\ sqrt {1-{\ frac {n} {N}}}} = {\ sqrt {1-f}}}

ottamaan huomioon tarkkuuden, joka saadaan näytteenotolla lähellä suurempaa osaa väestöstä. Vaikutus FPC on, että virhe on nolla, kun näytteen koko n on yhtä suuri kuin populaation koko N .

Tämä tapahtuu kyselytutkimusmenetelmissä otannassa ilman korvaamista . Jos näytteenotto vaihdetaan, FPC ei tule peliin.

Korjaus korrelaatioon otoksessa

Odotettu virhe keskiarvolla A näytteelle, jossa on n datapistettä, joiden näytepainotuskerroin ρ . Puolueeton keskivirhe koealojen kuin ρ = 0 poikkiviiva log-log kaltevuus -½.

Jos mitatun määrän A arvot eivät ole tilastollisesti riippumattomia, mutta ne on saatu parametriavaruuden x tunnetuista sijainneista , voidaan saada puolueeton estimaatti keskiarvon todellisesta standardivirheestä (itse asiassa korjaus keskihajontaosasta) kertomalla otoksen laskettu standardivirhe kertoimella f :

{\ displaystyle f = {\ sqrt {\ frac {1+ \ rho} {1- \ rho}}},}

jossa näyte bias kerroin ρ on laajalti käytetty Prais-Winsten arvio on autokorrelaation -coefficient (määrä välillä -1 ja +1) kaikkien näytteen kohta paria. Tämä likimääräinen kaava on tarkoitettu kohtalaisille ja suurille otoskokoille; viite antaa tarkat kaavat mille tahansa otoksen koolle, ja sitä voidaan soveltaa voimakkaasti autokorreloituihin aikasarjoihin, kuten Wall Streetin osakekursseihin. Lisäksi tämä kaava toimii sekä positiivisille että negatiivisille ρ. Katso myös puolueeton keskihajonnan arviointi lisää keskustelua varten.

Languages

In other projects