Yksinkertainen satunnainen näyte - Simple random sample
In tilastojen , joka on yksinkertainen satunnainen otos (tai SRS ) on osajoukko on yksilöiden (a näyte ) valitaan suurempi joukko (a populaatio ), jossa osajoukko yksilöiden valitaan sattumanvaraisesti , kaikki samalla todennäköisyydellä. Srs: ssä jokaisella k yksilön osajoukolla on sama todennäköisyys, että hänet valitaan otokseen kuin mikä tahansa muu k yksilön osajoukko . Yksinkertainen satunnaisnäyte on puolueeton näytteenottotekniikka. Yksinkertainen satunnaisnäyte on perusnäytteenottotapa ja voi olla osa muita monimutkaisempia näytteenottomenetelmiä.
Johdanto
Yksinkertaisen satunnaisotannan periaate on, että jokaisella nimikkeellä on sama todennäköisyys tulla valituksi. Oletetaan esimerkiksi, että N opiskelijaa haluaa saada lipun koripallo -otteluun, mutta heille on vain X < N -lippuja, joten he päättävät saada oikeudenmukaisen tavan nähdä kuka pääsee. Sitten kaikille annetaan numero välillä 0 -N -1, ja satunnaislukuja luodaan joko sähköisesti tai satunnaislukutaulukosta. Numerot, jotka ovat alueen 0 -N -1 ulkopuolella, jätetään huomiotta, samoin kuin kaikki aiemmin valitut numerot. Ensimmäiset X -numerot tunnistavat onnekkaat lipun voittajat.
Pienissä ja usein suurissa populaatioissa tällainen näytteenotto tehdään tyypillisesti " ilman korvausta ", eli tarkoituksellisesti vältetään valitsemasta väestön jäsen useammin kuin kerran. Vaikka yksinkertainen satunnaisnäytteenotto voidaan suorittaa korvaamalla, tämä on harvinaisempaa ja sitä kuvataan tavallisesti täydellisemmin yksinkertaisena satunnaisnäytteenottona korvaamisen kanssa . Näytteet ilman vaihtoa eivät ole enää riippumattomia, mutta täyttävät silti vaihdettavuuden , joten monet tulokset ovat edelleen voimassa. Lisäksi pienestä näytteestä suuresta populaatiosta näytteenotto ilman korvaamista on suunnilleen sama kuin näytteenotto korvaamalla, koska todennäköisyys valita sama yksilö kahdesti on pieni.
Puolueeton satunnaisvalinta yksilöistä on tärkeä, jotta jos otoksia otettaisiin paljon, keskimääräinen otos edustaa tarkasti populaatiota. Tämä ei kuitenkaan takaa, että tietty otos edustaa täydellisesti väestöä. Yksinkertainen satunnaisotanto mahdollistaa vain ulkoisesti pätevien johtopäätösten tekemisen koko populaatiosta otoksen perusteella.
Käsitteellisesti yksinkertainen satunnaisotanta on yksinkertaisin todennäköisyysnäytteenottotekniikka. Se vaatii täydellisen näytteenottokehyksen , jota ei ehkä ole saatavilla tai mahdollista rakentaa suurille populaatioille. Vaikka koko kehys olisi saatavilla, tehokkaammat lähestymistavat voivat olla mahdollisia, jos populaation yksiköistä on saatavilla muuta hyödyllistä tietoa.
Sen etuna on, että se on vapaa luokitusvirheistä ja vaatii vähimmäistietoa muusta väestöstä kuin kehyksestä. Sen yksinkertaisuus tekee myös suhteellisen helpoksi tulkita tällä tavalla kerättyjä tietoja. Näistä syistä yksinkertainen satunnaisotanta sopii parhaiten tilanteisiin, joissa populaatiosta ei ole paljon tietoa ja tiedonkeruu voidaan suorittaa tehokkaasti satunnaisesti jaetuista kohteista tai jos näytteenottokustannukset ovat riittävän pienet, jotta tehokkuus olisi vähemmän tärkeä kuin yksinkertaisuus. Jos nämä ehdot eivät täyty, ositettu näytteenotto tai rypälinäytteenotto voi olla parempi valinta.
Yksinkertaisen satunnaisotoksen ja muiden menetelmien suhde
Saman todennäköisyyden näytteenotto (epsem)
Näytteenottomenetelmää, jolle jokaisella yksittäisellä yksiköllä on sama mahdollisuus tulla valituksi, kutsutaan yhtä todennäköisyyden näytteenottoksi (lyhyt epsem).
Yksinkertaisen satunnaisnäytteen käyttäminen johtaa aina epsemiin, mutta kaikki epsem -näytteet eivät ole SRS. Jos esimerkiksi opettajalla on luokka, joka on järjestetty viidelle kuuden sarakkeen riville ja hän haluaa ottaa satunnaisen otoksen, jossa on viisi oppilasta, hän voi valita yhden kuudesta sarakkeesta sattumanvaraisesti. Tämä olisi epsem -näyte, mutta kaikki 5 oppilaan osajoukot eivät ole yhtä todennäköisiä täällä, koska vain yksittäiseksi sarakkeeksi järjestetyt osajoukot ovat valittavissa. On myös tapoja rakentaa monivaiheinen otanta , jotka eivät ole srs, kun lopullinen näyte on epsem. Esimerkiksi järjestelmällinen satunnaisotanta tuottaa otoksen, johon jokaisella yksittäisellä yksiköllä on sama todennäköisyys sisällyttää, mutta eri yksikköjoukkoilla on eri todennäköisyydet tulla valituksi.
Näytteet, jotka ovat epsem, ovat itsepainottavia , mikä tarkoittaa, että valintatodennäköisyyden käänteinen kullekin näytteelle on sama.
Ero järjestelmällisen satunnaisotoksen ja yksinkertaisen satunnaisotoksen välillä
Ajatellaanko koulua, jossa on 1000 oppilasta, ja oletetaan, että tutkija haluaa valita 100 heistä jatko -opintoihin. Kaikki heidän nimensä saatetaan laittaa ämpäriin ja sitten 100 nimeä voidaan vetää ulos. Sen lisäksi, että jokaisella henkilöllä on yhtä suuret mahdollisuudet tulla valituksi, voimme myös helposti laskea valitun henkilön todennäköisyyden ( P ), koska tiedämme otoksen koon ( n ) ja populaation ( N ):
1. Jos jokin henkilö voidaan valita vain kerran (eli valinnan jälkeen henkilö poistetaan valintapoolista):
2. Jos jokin valittu henkilö palautetaan valintapooltiin (eli hänet voidaan valita useammin kuin kerran):
Tämä tarkoittaa, että jokaisella koulun oppilaalla on joka tapauksessa noin 1/10 mahdollisuus tulla valituksi tällä menetelmällä. Lisäksi millä tahansa 100 opiskelijan yhdistelmällä on sama todennäköisyys valita.
Jos satunnaisotannassa käytetään järjestelmällistä mallia, sitä kutsutaan "järjestelmälliseksi (satunnaisnäytteeksi)". Esimerkki olisi, jos koulun oppilaiden nimiin olisi liitetty numeroita, jotka vaihtelevat välillä 0001 - 1000, ja valitsimme satunnaisen lähtökohdan, esim. 0533, ja valitsimme sen jälkeen joka kymmenennen nimen, jotta saisimme 100: n otoksemme 0003, kun se on saavuttanut 0993). Tässä mielessä tämä tekniikka muistuttaa klusterinäytteenottoa, koska ensimmäisen yksikön valinta määrää loput. Tämä ei ole enää yksinkertainen satunnaisotanta, koska joillakin 100 opiskelijan yhdistelmillä on suurempi valintatodennäköisyys kuin toisilla - esimerkiksi {3, 13, 23, ..., 993} on 1/10 mahdollisuus valita, kun taas {1 , 2, 3, ..., 100} ei voi valita tällä menetelmällä.
Näytteenotto kaksijakoisesta populaatiosta
Jos väestön jäseniä on kolmenlaisia, sanotaan "sininen", "punainen" ja "musta", punaisten elementtien määrä tietyn kokoisessa näytteessä vaihtelee otoksen mukaan ja on siten satunnaismuuttuja, jonka jakaumaa voidaan tutkia. Tämä jakauma riippuu punaisten ja mustien elementtien määrästä koko populaatiossa. Yksinkertaisella satunnaisnäytteellä, joka on korvattu, jakauma on binomijakauma . Yksinkertaiselle satunnaisnäytteelle ilman korvaamista saadaan hypergeometrinen jakauma .
Algoritmit
Useita tehokkaita algoritmeja yksinkertaiselle satunnaisotannalle on kehitetty. Naiivi algoritmi on tasapeli-algoritmi, jossa poistamme jokaisessa vaiheessa kohteen siinä vaiheessa yhtä suurella todennäköisyydellä joukosta ja asetamme kohteen näytteeseen. Jatkamme, kunnes meillä on halutun kokoinen näyte . Tämän menetelmän haittapuoli on se, että se vaatii satunnaisen pääsyn joukkoon.
Valinnan hylkäämisalgoritmi, jonka ovat kehittäneet Fan et ai. vuonna 1962 vaaditaan yksi tiedonsiirto; se on kuitenkin peräkkäinen algoritmi ja vaatii tietoa kohteiden kokonaismäärästä , jota ei ole saatavilla suoratoistoskenaarioissa.
Sunter osoitti hyvin yksinkertaisen satunnaislajittelualgoritmin vuonna 1977. Algoritmi yksinkertaisesti määrittää kullekin kohteelle avaimeksi avaimena satunnaisluvun, joka on peräisin tasaisesta jakautumisesta , lajittelee sitten kaikki kohteet avaimella ja valitsee pienimmät kohteet.
J. Vitter ehdotti vuonna 1985 säiliön näytteenottoalgoritmeja , joita käytetään laajalti. Tämä algoritmi ei vaadi tietoa populaation koosta etukäteen, ja se käyttää jatkuvaa tilaa.
Satunnaisnäytteenottoa voidaan myös nopeuttaa ottamalla näytteitä rakojen jakautumisesta näytteiden välillä ja ohittamalla raot.
Katso myös
- Monivaiheinen näytteenotto
- Ei -todennäköinen otanta
- Mielipidekysely
- Kvantitatiivinen markkinointitutkimus
- Näytteenotto
- Bernoullin näytteenotto
- Poisson -näytteenotto
Viitteet
the
Ulkoiset linkit
-
Media, joka liittyy satunnaiseen näytteenottoon Wikimedia Commonsissa