keskiviikko 26. marraskuuta 2008

Hypoteesin testaus

Tilastoista vedettävien johtopäätösten kanssa joudutaan elämään epävarmuuden ja epätarkkuuden alaisuudessa. Ajatellaan esimerkiksi, että kolikkoa on heitetty 100 kertaa ja on saatu tulokseksi 51 kruunaa ja 49 klaavaa. Onko nyt pääteltävä, että kolikko on harhainen vai voisiko kyseessä olla puhtaasti sattuma. Saman ongelman kohtaamme käytännössä kaikkia tilastoja tulkitessamme, joten kyseisen epävarmuuden hallinta on laadukkaan keskustelun kannalta ratkaisevan tärkeää.

Keskeinen keino sen määrittämiseen, onko jokin tilastollinen tulos vain sattumaa, on hypoteesin testaus.

Tavallisesti muodostetaan niin sanottu nollahypoteesi H0 ja vaihtoehtoinen hypoteesi H1, joiden totuutta tarkastellaan aineiston perusteella. Aiemmassa kolikonheittoesimerkissä voitaisiin siis ottaa nollahypoteesiksi se, että raha on harhainen ja vaihtoehtoisena hypoteesina olisi se, että raha on harhaton.

Seuraavaksi tutkitaan, onko tilastosta saatu informaatio riittävän vahvaa nollahypoteesin hylkäämiseksi. Testille valitaan merkitsevyystaso, joka ilmaisee, kuinka suuren niin sanotun 1. lajin virheen eli hylkäysvirheen olemme valmiita tekemään eli se kuvaa todennäköisyyttä tapahtumalle, jossa nollahypoteesi on tosi (raha on harhainen), mutta testin tuloksena nollahypoteesi hylätään (eli päättelemme rahan olevan harhaton). Tavallisia valintoja merkitsevyystasoksi ovat yksi tai viisi prosenttia.

Sanokaamme, että olemme kiinnostuneita harrastamaan vedonlyöntiä kolikonheitosta. Mitä suuremmalla summalla olemme pelaamassa, sitä varmempia haluamme aluksi olla siitä, että kolikko on harhaton. Mitä varmempia haluamme olla johtopäätöksestämme, sitä pienempi merkitsevyystaso on valittava.

Testin lopputuloksena nollahypoteesi joko jää voimaan tai se hylätään, mikä antaa todistusaineistoa sen tueksi, että vaihtoehtoinen hypoteesi saattaisi olla oikea. Vaikka nollahypoteesi jäisi voimaan, se ei sinänsä tarkoita, että H0 olisi välttämättä oikea, vaan todistusaineisto ei vain ollut riittävän vakuuttavaa sen hylkäämiseksi.

Disclaimer: Olen tehnyt ja tulen tekemään virheitä blogissani julkaistavissa laskelmissa, koska niiden julkaisukynnys on tarkoitus pitää matalana. Niitä saa ja pitääkin kritisoida, jolloin kenties päästään aikanaan parempaan tulokseen. Olen kiinnostunut oppimisesta ja älyllisestä rehellisyydestä.

1 kommentti:

Olkinukke kirjoitti...

Sain yksityiskeskustelussa kriittistä (ja täysin aiheellista) palautetta tästä tekstistäni ja lupaan tietysti parantaa esitystäni myöhemmässä vaiheessa, kun näitä asioita tarkemmin käsittelen.