Luku 12
Olen useamman päivän ajan laiminlyönyt tilastotieteitä. Perjantaina kävimme kaverin kanssa leffassa ja syömässä, eilen puolestaan kiertelimme miehen kanssa kauppoja, koska minulle iski sisustusinto ja halusin laittaa olohuoneemme hieman uudempaan uskoon.
Aika lukujen 1-4 alkaa olemaan vähissä ja ensi viikolla vaihtuu kuukausi, jolloin on aika siirtyä lukuihin 5-6. Muutama päivä tässä vielä kuitenkin on ja ne aion käyttää kirjaamalla blogiin keskeisimpiä asioita luvuista 2-4 sekä tehdä muutama harjoitustehtävä pääsykoekirjasta.
Luku 2: Tutkimusaineiston kerääminen
Tutkimuksella pyritään aina selvittämään jonkin perusjoukon ominaisuuksia. Ensin tuleekin ratkaista, tehdäänkö tutkimus kokonaistutkimuksena, jossa jokainen populaation otantayksikkö otetaan tarkasteltavaksi. Mikäli populaatio on suuri, on kokonaistutkimus harvoin mahdollinen. Usein vaihtoehtona on ottaa tarkasteluun vain osa populaatiosta ja suorittaa otantatutkimus. Tällöin ajatellaan tämä osajoukko oikein valittuna edustaa koko populaatiota. Osajoukkoa kutsutaan otokseksi. Otoksen tärkein ehto on, että jokaisella yksiköllä on yhtä suuri todennäköisyys tulla valituksi. Jos ehto ei täyty, on kyseessä näyte. Otos on silloin edustava, kun otantayhksiköiden ominaisuudet vstaavat ominaisuuksiltaan perusjoukkoa joka suhteessa. Otos ei voi kuitenkaan olla koskaan täysin populaation kantainen. Tätä poikkeamaa sanotaan otantavirheeksi.
Otantatutkimus vai kokonaistutkimus?
Otantatutkimuksilla on hyviä puolia ja niitä tehdäänkin paljon. Otantatutkimukset on edullisempia, vähemmän aikaa vieviä ja helpompia hallinta kuin kokonaistutkimukset. Otosten perusteella tehtävät tutkimukset ovat kuitenkin osittain epätarkkoja, koska kyselyä ei tehdä koko populaatiolta. Kokonaistutkimus onkin järkevää tehdä, jos populaatio on pieni, esimerkiki 100 tilastoyksikköä.
Otantamenetelmät
Otantatutkimus on luotettava silloin, kuin otos on ominaisuuksiltaan riittävän paljon populaation kaltainen. Tätä varten on kehitetty otantamenetelmiä. Otantamenetelmät voidaan jakaa kahteen ryhmään sen mukaan, onko kyseessä otos vai näyte.
Otantamenetelmät:
- Yksinkertainen satunnaisotanta
Perusmenetelmä, jossa otantayksiköt pomitaan satunnaisesti. Etuna on, että otoson helppo toimia erityisesti silloin, kun populaatio on tarkkaan tunnettu ja sen jäsenistä on saatavilla valmis luettelo. Haittana on, että ominaisuudet saattavat vaihdella huomattavasti otoksesta toiseen. Menetelmä on myös melko työläs. Satunnaisotantaa ei voida suorittaa jos populaatio ei ole tarkkaan tunnettu.
- Systemaattinen otanta
Jos populaatio on mahdollista asettaa jonoon tai populaatiossa on luonnollinen järjestys, voidaan käyttää systemaattista otantaa. Jonosta pomitaan tasaisin välimatkoin tai väliajoin otantayksikkö, kunnes otos on kerätty. Ensn määritellään poimintaväli ja määritellään otoskoko. Jos poimintaväliksi valitaan ensimerkiksi , populaatiosta valitaan otokseen joka viideskymmenes otantayksikkö (100% / 50 = 2 % populaatiosta). Jos tunnetaan populaation koko, voidaan käyttää kaavaa:
k = N/n
k= poimintaväli
N=populaation koko
n= otoskoko
Lisäksi tulee päättää ensimmäinen mukaan tuleva yksikkö, esimerkiksi arpomalla 1:n ja k:n väliltä, esimerkiksi satunnaislukuja käyttämällä.
Suurin etu on, ettei populaatiota tarvitse tuntea etukäteen, mutta käytettävä kuitenkin varovasti, ettei poiminta tapahdu syklien harjalta tai pohjalta.
- ositettu otanta
Populaatio jaetaan osiin, eli ositteisiin. Ositteet yhdessä kattavat populaation. Ositteiden jakamisen jälkeen jokaisesta ositteesta poimitaan erikseen otos jotakin otantamentelmää käyttäen. Esimerkiksi voidaan jakaa miehiin ja naisiin ja otokseen poimitaan suhteessa yhtä paljon miehiä ja naisia kuin heitä on populaatiossa (suhteellinen kiintiöotanta). Ositus varmistaa, että miesten ja naisten suhde otoksessa pysyy populaatiota vastaavana. Ositteet voidaan myös edelleen jakaa, esimerkiksi työssäkäyviin ja työttömiin.
Populaatio on tunnettava etukäteen, jotta ositettu otanta voidaan suorittaa. Etuna on, että antaa tarkempia tuloksia kuin yksinkertainen satunnaisotanta.
- ryväsotanta eli klusteriotanta.
On kaksivaiheinen otantamenentelmä, jossa populaatio jaetaan toisiaan poissulkeviin osajoukkoihin, eli ryppäisiin. Jako tehdään niin, että jokainen ryväs on ominaisuuksiltaan samankaltainen kuin perusjoukko. Ryväsotannan ja ositetun otannan erona on, että ryväsotannan jokainen ryväs sisältää kaikki perusjoukon ominaisuudet ja ovat keskenään mahdollisimman samankaltaiset.
Ryväsotanta on helppo tehdä ja menetelmä on joustava ja edullinen. Heikkoutena on, ettei aina ole helppoa muodostaa rypäitä, jotka ovat toistens kaltaisia.
Näytementelmät:
- Harkinnanvainen otanta
Poimitaan otokseen sellaisia tilastoyksikköjä, jotka ovat ennestään tuttuja ja helposti saatavilla. Otos ei ole yleistettävissä populaatioon ja vaatii aihealueen ja peusjoukon tuntemista. Harkinnanvarainen otanta on nopea, joustava ja edullinen. Sitä käytetään lähinnä esitutkimuksiin.
- Kiintiöotanta
Perusjoukko tai kehikko jaetaan joidenkin mitattavien ominaisuuksien osalta luokkiin. Esimerkiksi sukupuoli, ikä, kotipaikka. Itse otos poimitaan harkinnanvaraisen otantaa tai systemaattista otantaa käyttäen. Kiintiöotantaa voidaan käyttää jos populaatio on tunnetaan etukäteen ja se, missä suhteessa otantayksiköt ovat jakautuneet eri luokkiin. Vaarana on huomattava harha., mutta on nopea, joustava ja halpa menetelmä. Parempi kuin harkinnanvarainen otanta, mutta ei voida yleistää populaatioon.
Otantatutkimuksen virhelähteitä
Ratkaistavaa on tutkia, mitkä seikat vaikuttavat tulokseen ja sen tarkkuuteen. Tärkeimpiä vaikuttavia tekijöitä on otantamenetelmä ja otoskoko. Virheitä on mahdollista yrittää välttää. Otantatutkimuksissa kokonaisvirhe muodostuu otantavirheestä ja otantaan liittymättömistä virheistä. Otantavirhe voi syntyä esimerkiksi silloin, kun valitaan tilanteeseen sopimaton otantamenetelmä, otos ei ole edustava tai otoskoko on liian pieni. Otantaan liittymättömiä virheitä ovat puolestaan esimerkiksi tutkittavien henkilöiden vastaamiseen liittyviä virheitä, tahalliset ja tahattomat virheellisten tietojen antamiset, vastausten virheellinen kirjaaminen, vastaajien auttaminen ja ohjeiden noudattamatta jättäminen.