perjantai 31. lokakuuta 2008

Yksittäistapaukset yleistettävä!

Palataan edellisen tekstini kohtaan kolme, johon joidenkin mielestä voi olla asiallista vastata vaihtoehto b. Yritän tuoda esiin eräitä syitä, miksi järkevä vastausvaihtoehto kysymykseen on nimenomaan vaihtoehto a.

Käsitellään kuitenkin yksittäistapausten yleistämistä hieman toisesta näkökulmasta, jotta asian perusideat tulevat selkeämmin esiin. Ajatellaan, että on olemassa jokin ihmisjoukko, jonka joillakin edustajilla on jokin ominaisuus, joka ei heti tällaisesta ihmisestä näy päällepäin, eikä muutenkaan ole helposti havaittavissa. Sanokaamme, että osalla heistä puuttuu oikea isovarvas.

Oletetaan aluksi, että heistä 20 prosentilta on mainittu ominaisuus. Nyt väitän, että tällaisen yksittäisen ihmisen kohdatessaan järkevä päätelmä on, että 20 prosentin todennäköisyydellä hänellä ei ole oikeaa isovarvasta. Ei siis pidä ajatella, että tilasto siis sanoisi, että isovarvas puuttuu varmasti, mutta mahdollisuus siihen on huomattavasti suurempi kuin muun väestön yksilön kohdatessaan.

Jokainen, joka väittää, että yksittäistapauksia ei voi yleistää, kertoo ilmeisesti, että kyseinen tilastotieto ei kerro kohdatusta yksilöstä yhtään mitään. Nimitän tätä ajattelutapaa jatkossa nimellä naiivi.

Entä, jos tilastojen mukaan todennäköisyys isovarpaan puuttumisesta olisikin 50 tai vaikkapa 80 prosenttia. Naiivin ajattelun mukaan mitään ongelmaa ei ole, eikä yksittäistapausta vieläkään voi yleistää. Todennäköisyystulkinta sen sijaan näyttää, että riski isovarpaan puuttumisesta kohdatulta yksilöltä on rajusti kasvanut edelliseen esimerkkiin verrattuna.

Annetaan tilastollisen osuuden edelleen kasvaa. Entä jos isovarvas puuttuu 99,999 prosentilta kyseisen ihmisryhmän edustajista? Tämä on edelleen pelkkä tilastollinen tosiasia, jota naiivin ajattelun mukaan ei saa yleistää. Todennäköisyystulkinta sanoo, että riski on edelleen kasvanut merkittävästi ja pitkässä sarjassa tapaamme ehdottomasti suurimmaksi osaksi varpaattomia yksilöitä, kun kyseisen populaation yksilön tapaamme.

Jos osuus kasvaa täyteen sataan prosenttiin, kyse ei välttämättä naiivin ajattelun mukaan enää ole samalla tavoin tilastosta, jota ei saa yleistää, vaan tosiasiasta, joka liittyy kaikkiin kyseisen ryhmän edustajiin. Tässä vaiheessa siis on selvää kaikille, että kenelläkään kohdatulla yksilöllä ei varmasti ole isovarvasta.

Todennäköisyystulkinta antoi siis koko tarkastelun ajan yhä kasvavan riskin siitä, että kohdatulla yksilöllä ei ole isovarvasta. Naiivi ajattelutapa ei nähnyt mitään eroa suhteellisen osuuden kasvaessa, mutta osuuden saavuttaessa 100 prosenttia syntyy hurja epäjatkuvuuskohta, jolloin naiivi ajattelijakin lopulta tunnustaa, että eihän sillä kohdatulla yksilöllä tietenkään sitä varvasta voi olla.

Naiivissa ajattelussa ei ole mitään järkeä. Tilastot kannattaa ja pitää yleistää yksittäistapauksiin. Kun kohdatusta yksilöstä sitten ajan myötä saadaan uutta tietoa, niin todennäköisyysarviota voidaan tarkentaa.

keskiviikko 29. lokakuuta 2008

Kysely tilastojen yleistämisestä

Ongelma tilastojen yleistettävyydestä on aina ajankohtainen. Selvitetään lukijoiden (heh) mielipiteitä asiasta pienellä kyselyllä:

1. Näet kadulla miehen puukottavan kolmea ohikulkijaa. Mies lähtee juoksemaan sinua kohti puukko kädessään. Miten toimit?

a) Juokset karkuun.
b) On hätiköityä vetää mitään johtopäätöksiä miehen tulevasta käytöksestä saatujen havaintojen perusteella. Häneen tulee suhtautua kuin keneen tahansa muuhunkin, eikä tuomita epäreilusti henkilöhistoriansa perusteella. Sitäpaitsi neloismurhaajat ovat tavattoman harvinaisia.

2. Olet etsimässä lapsellesi lastenhoitajaa. Naapurin kiltti setä tulee tarjoamaan auttavaa kättään. Tiedät hänen istuneen vankilassa puolet elämästään toistuvista lapsiin sekaantumisista, joihin hän on syyllistynyt aina nopeasti vapautumisensa jälkeen. Miten toimit?

a) Kieltäydyt kohteliaasti tarjotusta avusta.
b) On hätiköityä vetää mitään johtopäätöksiä miehen tulevasta käytöksestä hänen henkilöhistoriansa perusteella. Vankilassa saatu sensitiivisyyskoulutus on varmasti tuottanut hedelmää ja häneen tulee suhtautua kuin keneen tahansa muuhunkin. Päästät hänet hoitamaan lastasi, sillä tuomitseminen historiatietojen perusteella on epäreilua. Ihmiset muuttuvat.

3. Mikä-mikä-maassa asustava sympaattinen vähemmistö on määräänsä nähden yliedustettuna maan raiskaustilastoissa siten, että kun kantaväestössä yksi sadastatuhannesta on syyllistynyt elämänsä aikana raiskaukseen, niin sympaattisen vähemmistön edustajista 20 henkilöä sadastatuhannesta on syyllistynyt raiskaukseen. Nainen törmää baarissa sympaattisen vähemmistön edustajaan, joka pyytää naisen jatkoille. Nainen on kiinnostunut lähtemään jatkoille, muttei ole kiinnostunut harrastamaan miehen kanssa seksiä. Onko todennäköisyys naisen raiskatuksi tulemiseksi jatkoilla erilainen kuin siinä tapauksessa, että nainen lähtisi jatkoille kantaväestöön kuuluvan henkilön kanssa.

a) Todennäköisyys raiskaukseen on näiden tietojen valossa 20-kertainen ja naisen kannattaa huomioida tämä päätöksenteossaan. Riskeillä on taipumus joskus realisoitua.
b) On epäreilua väittää, että raiskauksen todennäköisyys kasvaisi sympaattisen vähemmistön edustajan mukaan lähdettäessä. Ihminen on yksilö! Nainen voi lähteä jatkoille hyvillä mielin kiinnittämättä huomiota turhiin tilastoihin.

4. Mikä-mikä-maassa asustavan sympaattisen vähemmistön edustajista kukaan ei ole tehnyt päivääkään työtä missään vaiheessa Mikä-mikä-maassa asumansa 600 vuoden aikana. Muut asukkaat ovat töissä 95 prosenttisesti. Mikä on mielestäsi sympaattisen vähemmistön todennäköisin työttömyysaste kymmenen vuoden kuluttua?

a) Tilanne tulee luultavasti jatkumaan samanlaisena, eikä mikään anna ymmärtää, että omaksuttu elämänmeno olisi muuttumassa. Työttymyysaste on luultavasti 100 % myös jatkossa.
b) On epäreilua vetää johtopäätöksiä sympaattisen vähemmistön aikaisemman käytöksen perusteella. He työllistyvät jatkossa siinä missä muutkin. Historiatietojen perusteella tuomitseminen on epäreilua. Ei ole mitään syytä olettaa, että työttömyysaste poikkeaisi muusta väestöstä.

5. Mikä-mikä-maahan on muuttanut sympaattinen vähemmistö, jonka työllisyysaste on ratkaisevasti heikompi kuin kantaväestön. Lisää sympaattisen vähemmistön edustajia olisi kiinnostunut pyrkimään maahan. Miten uudet sympaattisen vähemmistön edustajat arviosi mukaan tulevat työllistymään?

a) Työllisyysaste pysyttelee luultavasti oleellisesti samalla tasolla kuin muullakin sympaattisella vähemmistöllä. Ei ole syytä olettaa, että nyt maahan tulossa oleva porukka olisi ratkaisevasti erilaista kuin maassa jo asusteleva.
b) He työllistyvät siinä missä kantaväestökin. On väärin olettaa, että he muka eivät työllistyisi sen kummemmin kuin aikaisemmin tulleet sympaattisen vähemmistön edustajat. He eivät ole samaa porukkaa, vaan heitä on kohdeltava yksilöinä.

Löytyykö rivistäsi molempia vaihtoehtoja? Miksi?