Hyppää pääsisältöön

Tilastojen seitsemän kuolemansyntiä: Näin sinua harhautetaan

Tilastojen 7 kuolemansyntiä pääkuva.
Tilastojen 7 kuolemansyntiä pääkuva. Kuva: Mikko Lehtola/Yle, Dean Drobot/Shutterstock tilastot,Klikkiotsikko

Ikivanhan puujalkavitsin mukaan on vale, emävale ja sitten vielä tilasto. Tämä ei tietenkään aina pidä paikkaansa. On kuitenkin totta, että joskus tilastoja esitetään tai tulkitaan väärin – tahattomasti tai jopa tahallisesti. Esittelemme seitsemän tällaista tapausta, joihin saattaa tiedotusvälineitä tai somea seuratessa törmätä.

1. Pystyakseli on katkaistu

Tilasto jossa pystyakseli on katkaistu ja siten vääristää esitystä
Tässä kuviossa pystyakseli on katkaistu ja asteikko alkaa vasta 90 000:sta. Tilasto jossa pystyakseli on katkaistu ja siten vääristää esitystä tilastot

Klikkisanomien levikki ei ole niin hurjassa nousussa kun he antavat kuvion avulla olettaa. Klikkisanomat vääristää levikkinsä nousua yksinkertaisella kikalla: katkaisemalla pystyakselin. Kun kaaviota katsotaan tarkemmin, niin huomataan, että levikki ei suinkaan ala nollasta, vaan vasta 90 000:sta. Tämän kikan avulla muutos näyttää suuremmalta kuin onkaan.

Samoilla tiedoilla ja oikein tehtynä kuvio näyttäisi tällaiselta:

Tilasto oikein tehtynä jossa pystyakseli alkaa nollasta
Tässä kuviossa pystyakseli alkaa oikeaoppisesti nollasta Tilasto oikein tehtynä jossa pystyakseli alkaa nollasta tilastot

Nyt pystyasteikkoa ei ole katkaistu eli asteikko alkaa nollasta. Huomataan, että muutos levikissä ei todellakaan ole niin suuri kuin edellinen kaavio antaa olettaa. Nyt levikin muutos suhteutuu paremmin koko levikkiin.

Tällaisissa tapauksissa puhutaan niin sanotusta valekertoimesta. Tässä tapauksessa se on sitä suurempi, mitä ylempää pystyakseli on katkaisu.

2. Kaavion muotosuhdetta on muutettu

Tilastokuvio jossa muotosuhdetta on venytetty pystysuunnassa
Kaavion kuviosuhdetta on venytetty pystysuunnassa. Tilastokuvio jossa muotosuhdetta on venytetty pystysuunnassa tilastot

Toimeentulotuen saajien määrä on toki nousussa, mutta ei niin rajusti kuin kaaviosta voisi ymmärtää. Tällä kertaa tekniikkana on, että kaavion muotosuhdetta on muutettu. Tämän huomaa siitä, että apuruudut (ns. hilaristikot) eivät ole neliön muotoisia. Näin muutosta saadaan liioiteltua – tai vähäteltyä (katso alla). Molemmissa kuvioissa ovat siis aivan samat tiedot, vaikka käyrät näyttävätkin erilaisilta.

Tilastokuvio jossa muotosuhdetta on venytetty vaakasuunnassa
Tilastokuvio, jossa muotosuhdetta on venytetty vaakasuunnassa. Tilastokuvio jossa muotosuhdetta on venytetty vaakasuunnassa tilastot

Taulukkolaskentaohjelmilla kaavion muotosuhde muuttuu helposti – vaikka tahtomatta – jos kaaviota venyttää pysty- tai vaakasuunnassa.

Kun kuvio tehdään oikein, kaavion ruudut ovat neliönmuotoisia ja kaavio näyttää tältä:

Tilastokuvio jossa muotosuhdetta on oikein
Tilastokuvio, jossa muotosuhde on oikein. Tilastokuvio jossa muotosuhdetta on oikein tilastot

3. Aika-akseli ei ole tasavälinen

Lööppi jossa on kuvio jossa ei ole tasavälinen aika-asteikko
Tilastokuvio, jossa aika-akseli ei ole tasavälinen. Kaavion luvut ovat esimerkkejä eivätkä perustu todellisiin tuottavuuslukuihin. Lööppi jossa on kuvio jossa ei ole tasavälinen aika-asteikko tilastotiede,tilastot

Kaaviosta saa jälleen aivan väärän käsityksen tuottavuuden kehityksestä. Tässä kikkana on muuttaa aika-akselin tasavälisyyttä. Kaavion alkupäässä pystyviivojen väli on 10 vuotta, lopussa se on vain yksi vuosi. Näin käyrä saadaan näyttämään sellaiselta kuin halutaan.

Oikea tasavälinen kaavio näyttää tältä. Pystyviivojen väli on nyt aina 5 vuotta. Nyt huomataan, että tuottavuus onkin oikeasti kasvanut lineaarisesti.

Sama tilastokuvio jossa aika-akseli on oikein
Tässä kaaviossa aika-akseli on oikeaoppisesti tasavälinen. Siinä on samat luvut kuin edellisessä kaaviossa. Sama tilastokuvio jossa aika-akseli on oikein tilastot

4. Nettikyselyä väitetään tutkimukseksi

Lööppi jossa väitetään että 60% suomalaisista poistaisi autoveron
Tässä lööpissä yleistetään nettikyselyn tulokset koskemaan kaikkia suomalaisia. Lööppi jossa väitetään että 60% suomalaisista poistaisi autoveron tilastot

Tiedotusvälineet ja erilaiset järjestöt tekevät nykyään paljon kyselyjä nettisivuillaan. Joskus niiden mainostetaan olevan tutkimuksia tai kyselytutkimuksia. Kyseessä ei kuitenkaan ole oikea tutkimus vaan kysely, jonka perusjoukkoa ei tunneta. Sen tuloksia ei voi yleistää koskemaan kaikkia suomalaisia.

Oikea kyselytutkimus perustuu edustavaan otokseen kaikista suomalaisista. Yleensä niissä vastaajien määrä on tarkoituksesta riippuen vähintään tuhat. Vaikka nettikyselyyn osallistuisi useampikin kuin tuhat vastaajaa, ei se silti tee siitä sen parempaa. Vastaajat eivät edelleenkään ole edustava otos suomalaisista, vaan vinoutunut näyte.

Tällaisen autoveroa koskevan nettikyselyn tulos olisi varmaankin hyvin erilainen, jos se olisi jonkin autolehden tai Vihreän langan sivuilla. Kumpikaan niistä ei kuitenkaan anna edustavaa, kaikkia suomalaisia koskevaa tutkimustulosta.

5. Riskitodennäköisyyksien kasvua liioitellaan

Lööppi jossa sairauden riskitodennäköisyyttä liioitellaan
Lööppi jossa sairauden riskitodennäköisyyttä liioitellaan tilastot

Usein tiedotusvälineissä on shokeeraavia otsikoita milloin minkäkin ruoka-aineen tms. aiheuttamista terveysvaikutuksista. Usein taustalla on ihan vakavasti otettava tutkimus ja riski saattaa todella kohota.

Usein kuitenkin unohdetaan riskitaso, joka voi olla jo alun perin hyvin pieni. Jos jonkin sairauden saamisen riskitaso on vaikka 1/10 000, niin 100 % lisäys riskitasoon merkitsee sitä, että riski on nyt 2/10 000. Toisin sanoen riskin kasvamisen jälkeen kaksi ihmistä kymmenestätuhannesta sairastuisi syöpään.

Riskitaso ei siis edelleenkään ole kovin korkea, ja on liioittelua puhua tappaja-aineesta.

6. Ei ymmärretä käsitteitä ja käytetään niitä väärin

Lööppi, jossa ei ymmärretä nuorisotyöttömyyden kasvua.
Lööppi, jossa ei ymmärretä nuorisotyöttömyyden kasvua. Kuva: Mikko Lehtola / Yle tilastot

Yksi tiedotusvälineissä toistuvasti esiintyvistä virheistä on nuorisotyöttömyyden yliarviointi. Tässä ongelmana on, että ei ymmärretä, mitä käsite nuorisotyöttömyys tarkoittaa. Se ei ole osuus kaikista ikäluokan nuorista, vaan vain työmarkkinoiden käytettävissä olevista nuorista.

Jos siis Tilastokeskuksen työvoimatutkimukseen mukaan vuoden 2018 maaliskuussa 15–24-vuotiaiden miesten työttömyysaste oli 25,6 %, ei se tarkoita, että yli neljännes nuorista olisi työttömänä. Tämä johtuu siitä, että puolet 15–24-vuotiaista miehistä on työvoiman ulkopuolella, esimerkiksi opiskelemassa tai armeijassa.

Maaliskuussa 2018 ikäluokkaan kuului 319 000 miestä, joista 39 000 luokiteltiin työttömiksi. Työttömiä nuoria miehiä oli siis oikeasti vain 12 prosenttia ikäluokasta.

7. Kausivaihtelua ei oteta huomioon

Lööppi, jossa ei ymmärretä ottaa huomioon kausityöttömyyttä.
Lööppi, jossa ei ymmärretä ottaa huomioon kausityöttömyyttä. Kuva: Mikko Lehtola / Yle tilastot

Tieto pitää periaatteessa paikkansa, kun verrataan huhtikuuta ja toukokuuta 2018. Tällä kertaa ongelmana on, että vertailussa ei oteta huomioon kausivaihtelua. Yleensä työttömien määrä vuosittain on nimenomaan toukokuussa kaikkein suurin, koska opiskelijoita tulee silloin paljon työmarkkinoiden käyttöön.

Oikea tapa olisi verrata työttömien määrää edellisen vuoden toukokuuhun, jolloin huomataan, että itse asiassa vuodessa työttömien määrä on laskenut 35 000 henkeä.

Toinen mahdollinen oikea tapa tutkia työttömyyden trendiä on verrata vuosineljänneksiä keskenään. Tällöin kausivaihtelun vaikutus ei ole niin suuri. Tässäkin tapauksessa huomataan, että työttömien määrä oli vuoden 2018 toisella neljänneksellä itse asiassa laskussa – ei nousussa.

Kausivaihtelun huomioonottaminen on työttömyydestä puhuttaessa tärkeää, sillä työttömyydessä on paljon luonnollista kausittaista vaihtelua eri aloilla. Esimerkiksi rakennusala työllistää enemmän kesällä, Lapin turismi taas enemmän talvella. Samoin kausivaihtelua esiintyy muun muassa teollisuustuotantoa, vientiä ja tuontia käsittelevissä tilastoissa.



Jutun pääasiallisina lähteinä on käytetty kalvosarjoja Tulosten visuaalinen esittäminen eli tilastografiikan perusteita (Vesa Kuusela) ja kirjaa Tilastot käyttöön! Opas tilastojen maailmaan (Jussi Simpura & Jussi Melkas, Gaudeamus 2013).

EDIT 10.4 klo 10.45: Artikkelin kuvista poistettu Klikkisanomat otsikko ja muutettu värejä väärien mielleyhtymien välttämiseksi.
EDIT: 15.4 klo 11.45 Poistettu lähteistä linkki tekijänoikeussyistä.

Keskustelu sulkeutuu 04.05.
Kommentit

Media- ja digitaidot