Luku 12

Olen useamman päivän ajan laiminlyönyt tilastotieteitä. Perjantaina kävimme kaverin kanssa leffassa ja syömässä, eilen puolestaan kiertelimme miehen kanssa kauppoja, koska minulle iski sisustusinto ja halusin laittaa olohuoneemme hieman uudempaan uskoon.

Aika lukujen 1-4 alkaa olemaan vähissä ja ensi viikolla vaihtuu kuukausi, jolloin on aika siirtyä lukuihin 5-6. Muutama päivä tässä vielä kuitenkin on ja ne aion käyttää kirjaamalla blogiin keskeisimpiä asioita luvuista 2-4 sekä tehdä muutama harjoitustehtävä pääsykoekirjasta. 

Luku 2: Tutkimusaineiston kerääminen

Tutkimuksella pyritään aina selvittämään jonkin perusjoukon ominaisuuksia. Ensin tuleekin ratkaista, tehdäänkö tutkimus kokonaistutkimuksena, jossa jokainen populaation otantayksikkö otetaan tarkasteltavaksi. Mikäli populaatio on suuri, on kokonaistutkimus harvoin mahdollinen. Usein vaihtoehtona on ottaa tarkasteluun vain osa populaatiosta ja suorittaa otantatutkimus. Tällöin ajatellaan tämä osajoukko oikein valittuna edustaa koko populaatiota. Osajoukkoa kutsutaan otokseksi. Otoksen tärkein ehto on, että jokaisella yksiköllä on yhtä suuri todennäköisyys tulla valituksi. Jos ehto ei täyty, on kyseessä näyte. Otos on silloin edustava, kun otantayhksiköiden ominaisuudet vstaavat ominaisuuksiltaan perusjoukkoa joka suhteessa. Otos ei voi kuitenkaan olla koskaan täysin populaation kantainen. Tätä poikkeamaa sanotaan otantavirheeksi

Otantatutkimus vai kokonaistutkimus?

Otantatutkimuksilla on hyviä puolia ja niitä tehdäänkin paljon. Otantatutkimukset on edullisempia, vähemmän aikaa vieviä ja helpompia hallinta kuin kokonaistutkimukset. Otosten perusteella tehtävät tutkimukset ovat  kuitenkin osittain epätarkkoja, koska kyselyä ei tehdä koko populaatiolta. Kokonaistutkimus onkin järkevää tehdä, jos populaatio on pieni, esimerkiki 100 tilastoyksikköä.  

Otantamenetelmät

Otantatutkimus on luotettava  silloin, kuin otos on ominaisuuksiltaan riittävän paljon populaation kaltainen. Tätä varten on kehitetty otantamenetelmiä.  Otantamenetelmät voidaan jakaa kahteen ryhmään sen mukaan, onko kyseessä otos vai näyte.

Otantamenetelmät:

  • Yksinkertainen satunnaisotanta

Perusmenetelmä, jossa otantayksiköt pomitaan satunnaisesti. Etuna on, että otoson helppo toimia erityisesti silloin, kun populaatio on tarkkaan tunnettu ja sen jäsenistä on saatavilla valmis luettelo. Haittana on, että ominaisuudet saattavat vaihdella huomattavasti otoksesta toiseen. Menetelmä on myös melko työläs. Satunnaisotantaa ei voida suorittaa jos populaatio ei ole tarkkaan tunnettu. 

  • Systemaattinen otanta

Jos populaatio on mahdollista asettaa jonoon tai populaatiossa on luonnollinen järjestys, voidaan käyttää systemaattista otantaa. Jonosta pomitaan tasaisin välimatkoin tai väliajoin otantayksikkö, kunnes otos on kerätty. Ensn määritellään poimintaväli ja määritellään otoskoko. Jos poimintaväliksi valitaan ensimerkiksi , populaatiosta valitaan otokseen joka viideskymmenes otantayksikkö (100% / 50 = 2 % populaatiosta). Jos tunnetaan populaation koko, voidaan käyttää kaavaa: 

k = N/n

k= poimintaväli
N=populaation koko
n= otoskoko

Lisäksi tulee päättää ensimmäinen mukaan tuleva yksikkö, esimerkiksi arpomalla 1:n ja k:n väliltä, esimerkiksi satunnaislukuja käyttämällä. 

Suurin etu on, ettei populaatiota tarvitse tuntea etukäteen, mutta käytettävä kuitenkin varovasti, ettei poiminta tapahdu syklien harjalta tai pohjalta. 

  • ositettu otanta

Populaatio jaetaan osiin, eli ositteisiin. Ositteet yhdessä kattavat populaation. Ositteiden jakamisen jälkeen jokaisesta ositteesta poimitaan erikseen otos jotakin otantamentelmää käyttäen. Esimerkiksi voidaan jakaa miehiin ja naisiin ja otokseen poimitaan suhteessa yhtä paljon miehiä ja naisia kuin heitä on populaatiossa (suhteellinen kiintiöotanta). Ositus varmistaa, että miesten ja naisten suhde otoksessa pysyy populaatiota vastaavana. Ositteet voidaan myös edelleen jakaa, esimerkiksi työssäkäyviin ja työttömiin. 

Populaatio on tunnettava etukäteen, jotta ositettu otanta voidaan suorittaa. Etuna on, että antaa tarkempia tuloksia kuin yksinkertainen satunnaisotanta. 

  • ryväsotanta eli klusteriotanta. 

On kaksivaiheinen otantamenentelmä, jossa populaatio jaetaan toisiaan poissulkeviin osajoukkoihin, eli ryppäisiin. Jako tehdään niin, että jokainen ryväs on ominaisuuksiltaan samankaltainen kuin perusjoukko. Ryväsotannan ja ositetun otannan erona on, että ryväsotannan jokainen ryväs sisältää kaikki perusjoukon ominaisuudet ja ovat keskenään mahdollisimman samankaltaiset. 

Ryväsotanta on helppo tehdä ja menetelmä on joustava ja edullinen. Heikkoutena on, ettei aina ole helppoa muodostaa rypäitä, jotka ovat toistens kaltaisia. 

Näytementelmät:

  • Harkinnanvainen otanta

Poimitaan otokseen sellaisia tilastoyksikköjä, jotka ovat ennestään tuttuja ja helposti saatavilla. Otos ei ole yleistettävissä populaatioon ja vaatii aihealueen ja peusjoukon tuntemista. Harkinnanvarainen otanta on nopea, joustava ja edullinen. Sitä käytetään lähinnä esitutkimuksiin. 

  • Kiintiöotanta

Perusjoukko tai kehikko jaetaan joidenkin mitattavien ominaisuuksien osalta luokkiin. Esimerkiksi sukupuoli, ikä, kotipaikka. Itse otos poimitaan harkinnanvaraisen otantaa tai systemaattista otantaa käyttäen. Kiintiöotantaa voidaan käyttää jos populaatio on tunnetaan etukäteen ja se, missä suhteessa otantayksiköt ovat jakautuneet eri luokkiin. Vaarana on huomattava harha., mutta on nopea, joustava ja halpa menetelmä. Parempi kuin harkinnanvarainen otanta, mutta ei voida yleistää populaatioon. 

Otantatutkimuksen virhelähteitä

Ratkaistavaa on tutkia, mitkä seikat vaikuttavat tulokseen ja sen tarkkuuteen. Tärkeimpiä vaikuttavia tekijöitä on otantamenetelmä ja otoskoko. Virheitä on mahdollista yrittää välttää. Otantatutkimuksissa kokonaisvirhe muodostuu otantavirheestä ja otantaan liittymättömistä virheistä. Otantavirhe voi syntyä esimerkiksi silloin, kun valitaan tilanteeseen sopimaton otantamenetelmä, otos ei ole edustava tai otoskoko on liian pieni. Otantaan liittymättömiä virheitä ovat puolestaan esimerkiksi tutkittavien henkilöiden vastaamiseen liittyviä virheitä, tahalliset ja tahattomat virheellisten tietojen antamiset, vastausten virheellinen kirjaaminen, vastaajien auttaminen ja ohjeiden noudattamatta jättäminen. 

 

 

suhteet oma-elama opiskelu

Luku 11

Tänään palautin oikeat kurssiharjoitukset Moodleen ja aloin äänittää ääneen lukemista luvusta 1.

Minulla on aina ollut pelko ääneen lukemista kohtaan. En tiedä onko kyseessä jokin lapsuudesta puskeva trauma, mutta ääneen lukeminen on minun pahin painajainen. Kun alan lukemaan ääneen, en pysty hahmoittamaan lukemaani, en muodostaa lauseita tai mielikuvia päässäni, suuta alkaa kuivaa ja alan änkyttämään.. Loppujen lopuksi alan keksimään miten lause jatkuu sen sijaan, että lukisin sen niin kuin siinä lukee. Olen kuitenkin kuvitellut, että siihen liittyy se, että joku kuuntelee. Olin väärässä — ilmeisesti riittää, että itse kuulen. En ymmärrä. Äänitin samaa kappaletta neljään kertaan, koska aloin änkyttämään vahvan epämukavuuden vallassa. Sain kuitenkin äänitettyä luvun 1 — reilun tunnin jälkeen.

Ajattelin vielä avata tähän blogiin mielestäni keskeisempiä asioita oppimisen tehostamiseksi: 

Tilastollinen ajatteluprosessi 

Tilastotiede on menetelmätiede, joka tutkii sitä, mitn erilaisiin havaintoihin perustuva tutkimus tulisi suorittaa.
Tilastotiedettä käytetään neljään tarkoitukseen: 
  1. Ihmisten kyky käsitellä suuria tietomassoja on rajallinen ja yksinkertaisten tilastomenetelmien avulla aineisto voidaan tiivistää ymmärrettävään muotoon 
2. Monet tapahtumat ovat stokastisia, eli niitä ei voida tietä etukäteen. Niistä voidaan kuitenkin tehdä probabilistinen ennuste, joka kertoo, kuinka todennäköisesti jokin tapahtuma tapahtuu. Stokastisen tapahtuman vastakohta on deterministinen tapahtuma, joka on täysin tiedossa etukäteen. 
3. Tilastollisten menetelmien avulla voidaan muodostaa tapahtumia kuvaavia malleja, joiden avulla voidaan esimerkiksi ennustaa tulevat tapahtumat edellisten tapahtumien perusteella. 
4. Tutkimusten tulokset halutaan usein yleistää koskemaan suuria ihmisjoukkoja, eli populaatioita, joiden pienoismalleista käytetään nimitystä otos

Tiede ja tieteelliset menetelmät

Ihmiset pyrkivät luonnostaan ymmärtämään mitä heidän ympärillään tapahtuu. Monet säännönmukaisuudet ovat kuitenkin sellaisia, emmenne välttämättä havaitse niitä pelkästään arkiajattelumme avulla. Säännönmukaisuudet voivat esimerkiksi olla niin heikkoja, jotta havaitsisimme ne tai voivat esiintyä niin suurina tietomassoinna, ettei tiedonkäsittelykapasiteetti mahdollista niiden havaitsemista ilman matemaattisia apuneuvoja. 

Tieteellisten menetelmien avulla kerätään systeemaattisesti ihmistä, luontoa ja yhteiskuntaa koskevaa uutta tietoa sekä täydennetään olemassa olevaa. Saatu tieto voidaan soveltaa ja käyttää päätöksenteon pohjana.

Tieteelliset johtopäätökset tehdään tavallisesti joko deduktiivisesti tai induktiivisesti: 
Deduktiivisessa päättelyssä lähdetään liikkeelle sellaisista premsseistä joiden tiedetään olevan tosia. Deduktiivinen päättely ei luo uutta tietoa, vaan paljastaa sellaista tietoa, joka sisältyy jo alunperin premsseihin. Induktiivisessä päättelyssä puolestaan edetään yksittäistapauksesta yleistykseen, jonka seurauksena uudet otaksumat tai mallit syntyvät. Vaarana on kuitenkin tehdä vääriä johtopäätöksiä. Tieteen edistämiseksi tarvitaan molempaa päättelyä. 

Tutkimusprosessi

1. Tutkimuksen suunnittelu
2. Tutkimusongelman asettaminen ja tavoitteden määrittely
3. Tutkimusstrategian asettaminen
4. Aineiston kerääminen
5. Aineiston kuvaaminen ja tiivistäminen
6. Tutkimusaineiston analysointi ja päätelmien tekeminen
7. Tulosten tulkinta ja johtopäätöksen tekeminen (tärkein vaihe)
8. Tulosten arvioiminen 
9. Tulosten raportointi
10. Jatkotutkimuksen suunnittelu. 

Tutkimustyyppejä

Teoreettinen tutkimus mittaa ympäröivän maailman ominaisuuksia. Usein puhdasta matematiikkaa ja perustuu usein aikaisempien havaintojen käyttämiseen. Uusia havaintoja ei kerätä. 

Empiirinen tukimus on aistihavaintojen tai mittauslaitteilla saatujen mittatulosten käsittelyyn perustuvaa. 

  • Kvalitatiivinen tutkimus vastaa kysymyksiin ”miksi/miten/millainen?” ja tutkimusaineistot ovat usein varsin suppeita. Tulokset esitetään esimerkiksi lauseina tai sanoina, ja tutkimustapaa käytetään lähinnä sosiaalitieteellisillä aloilla. 
     
  • Kvantatiivinen tutkimus vastaa kysymyksiin ”mikä/missä/kuinka usein/miten paljon?”. Tutkimusaineistot ovat usein suuria ja  tulokset esitetään numeraalisesti. Käytännössä lähes kaikki tutkimukset ovat kvantatiivisia. Kvantatiiviset tutkimukset voidaan edelleen jakaa:
           –  Havainnoiviin tutkimuksiin, joissa tavoitellaan ilmiön tutkimistä pidemmällä aikavälillä  (pitkittäistutkimukset). Tällästä tapausta                    sanotaan ilmiön prospektiiviseksi ilmiöksi. Mikäli kehittymistä seurataan takautuvalta ajalta, tutkimusta sanotaan retrospektiiviseksi                ilmiöksi. 
           –  Kokeellisiin tutkimuksiin, joissa tutkija muuntelee jotakin riippumatonta muuttujaa. Tällöin voidaan tehdä päätelmiä syy-                                seuraussuhteista. 

Poikkileikkaustutkimus tutkii tiettynä ajankohtana tietyn ilmiön tai ilmiöiden eri puolia.

Survey-tutkimus eli kysely- ja haastattelututkimus

 Kuvaileva tutkimus esittää asiatilan tiettynä hetkenä tai pidemmän ajan kuluessa. 

 Case -tutkimus eli tapaustutkimus, joka tutkii tiettyä yksittäistapausta mahdollisimman tarkasti. 

Perustutkimus pyrkii saamaan selville, millaisia asiat tai ilmiöt ovat perusluonteeltaan. 

Soveltava tutkimus pyrkii käytännön tavoitteiden kautta itsenäisiin ja omaperäisiin tiedon keruuseen nojautuen perustutkimuksen tuloksiin. 

Mittaaminen, validiteetti ja reabiliteetti

Populaatio koostuu tutkimusyksiköistä, joista käytetään nimitystä tilastoyksiköt. Tilastoyksiköistä kerätään tietoja mittaamalla ja mittaaminen kohdistuu johonkin muuttujaan. Muuttajat ovat siis tutkimuksessa mittauskohteita. 

  • Kvalitatiiviset muuttujat ovat laadullisia muuttujia, eli mittaus kertoo vain mihin luokkaan muuttuja kuuluu eikä luokilla ole suuruusjärjestysstä. 
      – Ovat aina diskreettisiin muuttujia, eli epäjatkuvia, jotka voivat saada vain yksittäisiä arvoja (mies/nainen)
  • Kvantatiiviset muuttujat ovat määrällisiä muuttujia, eli numeroarvoja. Kvantatiivisilla muuttujilla on aina suuruusjärjestys ja niillä voidaan suorittaa laskutoimistuksia.
        – Jatkuvat muuttujat, jotka voivat saada mitä tahansa arvoja. 

Mitta-asteikot

Luokitteluasteikko 

  • Vain ennalta määrätyt luokat joiden järjestyksellä ei ole merkitystä (mies/nainen, veriryhmä, sukupuoli..)
  • Tilastoyksikkö voi kuulua vain yhteen luokkaan 
  • Ei suoriteta laskutoimistuksia
  • Diskreettiset muuttujat

Järsjestysasteikko

  • Vain ennalta määrätyt luokat, joilla on yksikäsitteinen järjestys (sotilasarvo, mielipidetutkimukset, kilpailun tulokset..)
  • Ei yleisesti suoriteta laskutoimistuksia
  • Diskreettiset muuttujat 

Välimatka-asteikko

  • Vain reaalilukuja, havaintoarvojen etäisyyden mittaaminen (montako astetta lämpimämpi kuin eilen..)
  • Ei absoluuttista 0 -pistettä
  • Voidaan suorittaa laskutoimistuksia: mediaani, keskiarvo, keskihajonta, kvartiilit, vinous ja huipukkuus, pearson. 
  • Jatkuvat muuttujat

Suhdeasteikko

  • Vain reaalilukuja, välimatka-asteikon erikoistapaus (lasten lukumäärä, pituus, paino..)
  • On absoluuttinen 0- piste. 
  • Voidaan suorittaa laskutoimistuksia: Mediaani, keskihajonta, variaatiokerroin, vinous ja huipukkuus

 

Reabiliteetti on mittarin luotettavuus, eli mittausvirheettömyys. 

Validiteetti puolestaan ilmoittaa missä määrin on mitattu sitä mitä pitikin, eikä ole merkitystä onko tulos oikea vai väärä. 

tyo-ja-raha opiskelu