Kun avaat tämän sivun, palvelimella alkaa tapahtua ja käynnistäsi alkaa kertyä tietoa. Erilaiset tunnisteet kertovat, millaista laitetta käytät, kuinka kauan vietät aikaasi sivulla ja kuinka pitkälle juttua luet. Lisäksi tekoäly tekee arvion siitä, mihin ikäryhmään mahdollisesti kuulut ja mitä sukupuolta olet.
Artikkelin lopussa näet tämän jutun yleisölukuja.
Tärkein datan keräämisen tunniste on selaimen eväste eli keksi (cookie). Se sisältää selaimen asetukset ja personointivalintasi kyseiseltä sivulta. Evästeiden avulla selviää myös käyttämäsi selainversio ja se, luetko juttua kännykästä, tietokoneelta vai kenties älytelevisiosta.
Evästeiden ansiosta tiedämme esimerkiksi sen, että useita juttuja luetaan nykyään enemmän mobiililaitteilla kuin perinteisillä tietokoneilla. Jutun pitää siis toimia sekä kännyköissä että tietokoneen ruudulla. Meidän toimittajien on tärkeä muistaa tämä, sillä teemme töitämme pääasiassa tietokoneella.
Selaimen tunnistamisen ansiosta verkkosivu tai sisältö skaalautuu laitteellesi sopivaksi. Kännykän ruudulla juttu näyttää toisenlaiselta kuin tietokoneella.

Millainen käyttäjä lukee ja kuinka kauan?
Yle seuraa myös sitä, miten kauan jollakin sivulla viihdyt ja mitä siellä teet: liikutatko kenties osoitinta tai skrollaatko sivua alaspäin. Tieto auttaa toimittajia arvioimaan, kiinnostaako juttu lukijoita ja mihin kohtaan tärkeimmät asiat kannattaa sijoittaa. Data perustuu siis sivun aukioloaikaan ja skrollaamiseen eikä tietenkään kerro sitä, luettiinko juttua oikeasti.
Data kertoo, mihin aikaan mitäkin artikkelia on luettu. Sen avulla voidaan suunnitella, milloin olisi otollinen aika julkaista ja esimerkiksi jakaa juttuja somessa.
Ylen Älykäs data ja asiakkuus -tiimin kehittämällä laskukaavalla pyrimme arvioimaan, mitä sukupuolta olet ja mihin ikäryhmään kuulut. Sukupuoli voi tuntua epäolennaiselta, mutta tiedoista on hyötyä, kun pohdimme, millaisia sisältöjä Ylen pitäisi tuottaa kiinnostaaksemme mahdollisimman monipuolista yleisöä. Ylen tehtävänä on palvella kaikkia suomalaisia.
Tiedämme esimerkiksi, että Yle Oppimisen yleisöstä enemmistö on naisia. Huomasimme myös, että Digitreenit-artikkelien lukijoista suurempi osa oli aluksi miehiä. Jouduimme pohtimaan, miten saisimme naisetkin kiinnostumaan enemmän Digitreenien kaikille hyödyllisistä sisällöstä ja nyt artikkeleita lukevat sekä miehet että naiset.
Ikäryhmätiedot taas hyödyttävät toimituksia, koska niillä on erilaisia tavoitekohderyhmiä: esimerkiksi Ylen nuorten toimitukset mm. Kioski, YleX suuntaavat sisältönsä pääasiassa alle 25-vuotiaille.
Mobiilimaailmassa IP-osoite ei enää ole niin kiinnostava tieto
On mahdollista selvittää myös laitteesi IP-osoite, joka on eräänlainen tietokoneen tunnistusnumero. Sen avulla yksilöitiin tietokoneita varsinkin kiinteiden yhteyksien aikana, jolloin esimerkiksi asuinpaikkoja käytettiin mainonnan kohdentamiseen. Tieto ei kuitenkaan ole enää yhtä tärkeä kuin aikaisemmin, koska suuri osa tämänkin artikkelin lukijoista käyttää mobiililaitetta ja IP-tunnus vaihtuu joka kerta, kun yhteys avataan.
Yle Areena käyttää IP-osoitetta tunnistaakseen, missä päin maailmaa ohjelmaa katsotaan. Näin varmistetaan, että sopimuksia tekijöiden sekä julkaisijoiden oikeuksista noudatetaan. Yle Tunnuksella Areenan sisältöjä voi katsoa myös EU-alueella, koska Tunnusta rekisteröitäessä varmistetaan, että kotipaikka on Suomessa. Verkkosivut ovat luettavissa missä tahansa maassa.
Jos olet tehnyt itsellesi Yle Tunnuksen, pääset tutkimaan, mitä Ylen sisältöjä on käyttänyt aiemmin. Tunnus helpottaa myös oman datan hallinnoimista, ja sen avulla pystyy näkemään, mitä tietoja itsestä on kerätty. Palvelun kautta voit halutessaan pyytää poistamaan Tunnuksen ja sen sisältämät tiedot.
Kun olet kirjautunut verkkosivulle, näet nimikirjaimesi oikeassa yläkulmassa (yle.fi-sovelluksen vasen yläkulma) -> Omat tiedot.
Kuvaa Yle Tunnuksen Omat tiedot - historia sivulta.
Numerot kertovat käyttäjien määrästä
Mittarit kertovat, miten jutut onnistuvat tavoittamaan yleisöä. Verkkoartikkeleiden kiinnostavuudesta kertovat mm. lukuaika, kommentit ja sometoiminnot. Lukuihin vaikuttaa myös se, millaista on päivän muu tarjonta: isot ja yllättävät uutiset voivat viedä huomiota ja lukuaikaa muulta sisällöltä.
Yle Areena kerää tietoa myös siitä, kuinka moni aloittaa videon katselun ja kuinka pitkälle sitä katsotaan. Video tulkitaan katsotuksi, kun sitä on katsottu 60% kokonaispituudesta. Videoiden katseluaikoja seurataan, jotta nähdään, miten pitkään video on kiinnostanut.
Yle ei tunnista yksittäisiä ihmisiä
Yle ei tunnista käyttäjien henkilöllisyyttä. Me emme siis tiedä, mitä Ylen sisältöjä kukin ihminen katsoo tai kuuntelee. Eväste- ja IP-tietoja säilytetään eri palvelimilla, joten niiden perusteella ei voi tunnistaa yksittäistä käyttäjää. Pilvipalvelut voivat kuulostaa aineettomilta, mutta tosiasiassa ne ovat konkreettisia tietokoneita. Ylen data säilytetään palvelimilla Irlannissa. Palvelimen omistajilla ei ole pääsyä koneillaan olevaan Ylen dataan.
Poikkeuksena edellä kerrottuun on Yle Tunnus, jolle tallennetaan rekisteröidyttäessä tiettyjä henkilötietoja. Asetukset ja historia kirjautuvat Tunnukselle, joten pääset käsiksi tietoihin ja saat halutessasi ilmoituksia riippumatta siitä, mitä laitetta käytät. Yle Tunnuksen tavoitteena on tarjota ihmisille yksilöllistä palvelua ja sitouttaa ihmiset Ylen käyttäjiksi. Ylen palvelujen käyttöä analysoitaessa tunnuskäyttäjien dataa käsitellään anonymisoituna eli yksittäisiä käyttäjiä ei voi yhdistää heidän antamaansa sähköpostiosoitteeseensa.
Jakolinkkien kautta siirtyy dataa kolmannelle osapuolelle
Tämänkin artikkelin yläosassa on painikkeita, joilla artikkelin voi jakaa eri some-palveluissa. Monet lukijat haluavat suositella lukemaansa, näkemäänsä tai kuulemaansa muillekin.
Ylen palveluissa käytettävät somejakopainikkeet on ohjelmoitu siten, että käyttäjän tiedot eivät leviä niiden välityksellä Ylen ulkopuolelle ilman netinkäyttäjän omaa toimintaa. Vasta kun klikkaat palvelun logolla varustettua jakopainiketta, avaat oven some-palveluun ja mahdollistat sen datankeruun. Somepalvelut tarjoavat verkkosivujen tekijöille valmiiksi koodattuja ilmaisia jakonappeja. Niiden ongelma on kuitenkin siinä, että ne avaavat automaattisesti väylän someen heti käyttäjän saapuessa sivulle.
Jos tulit tähän artikkeliin Facebook-linkin kautta, saatat lukea sitä Facebookin selaimessa, joten siitä siirtyy tietoa myös FB:n palvelimille. Mitä tiedolla tehdään ja miten sitä käsitellään, sen suhteen joudumme luottamaan Facebookin data-sivustoon.
Twitter ja Facebook -upotukset keräävät dataa ulkopuolisille
On muitakin tilanteita, joissa dataa valuu kolmansille osapuolille. Niitä ovat esimerkiksi sosiaalisen median upotukset. Mikäli jutussa on upotuksena esimerkiksi poliitikon julkaisema tviitti, tietoa kerää Ylen lisäksi myös Twitter. Tässäkin joudumme luottamaan palvelun omaan selosteeseen.
Ylessäkin pohditaan upotusten käyttöä aina tapauskohtaisesti. Sosiaalisen median upotusten käytölle tulee olla journalistiset perusteet. Verkkosisältöjen tekijän on tiedettävä minne kaikkialle sivulle tulevien käyttäjien data leviää. Siitä näkökulmasta olisi selkeämpi liittää artikkeliin kuvakaappaus somepostauksesta kuin upottaa sisältöä suoraan artikkeliin. Kuvan huonona puolena on, että sitä klikkaamalla ei pääse näkemään alkuperäistä postausta ja siihen liittyviä muita kommentteja.
Yle informoi sosiaalisen median liitännäisten käytöstä evästekäytännöissään.
Yle on kiinnostunut siitä, mitä kautta ihmiset artikkeliin tulevat. Tieto auttaa parantamaan sisältöjen löydettävyyttä. Toiset jutut leviävät somessa, toiset taas luetaan suoraan Ylen omilta sivuilta.
Miksi keräämme dataa?
Datasta on hyötyä erityisesti toimituksille. Se auttaa ymmärtämään, millaiset sisällöt ihmisiä kiinnostavat ja miten sitä kannattaa tarjota, jotta ne tavoittaisivat mahdollisimman monia Yle-veron maksajia. Päätökset sisällöistä luonnollisesti tehdään journalistisin perustein ja data on yksi työkalu, jolla julkaisuja arvioidaan.
Minä toimittajana olen kiinnostunut, miten tämäkin artikkeli otetaan vastaan. Miten hyvin se löytää yleisönsä ja kuinka hyvin se "pitää" eli luetaanko se loppuun asti. Siitä saattaa olla apua ensi kerralla, kun käsittelen vastaavanlaista tai miksei ihan toisenlaistakin aihetta.
Artikkelista saadaan tietoa, joka kertoo tavoittavuudesta ja hyödyntää toimitusta tulevaisuudessa.
Tieto on lähes reaaliaikaista, joten toimitukset pystyvät reagoimaan ja tekemään muutoksia nopeasti. Joskus vaikkapa otsikon tai kuvan vaihtaminen voi lisätä jutun huomioarvoa ja houkutella lisää lukijoita. Nämä toiminnat on mahdollista myös automatisoida ns. autonomisen tekoälyn avulla.
Suuri lukijamäärä voi kertoa myös siitä, että aiheesta halutaan lisää tietoa ja siitä kannattaa tehdä lisää juttuja. Se ei kuitenkaan aina kerro, onko joku artikkeli onnistunut tavoitteissaan: joskus kohdeyleisö on pienempi ja toisaalta jutulla voi olla muutakin vaikuttavuutta kuin suuret lukijämäärät.
Yle käyttää mm. Adoben ja Chartbeatin ohjelmistoja yleisötietojen keräämisessä. Esimerkiksi tämänkin jutun lukijamääriä Yle Oppimisen toimitus seuraa reaaliaikaisesti Chartbeatistä. Chartbeat kertoo, kuinka monta yksittäistä kävijää jutussa on ja kuinka kauan kävijät keskimäärin sivulla viipyvät.
Kuvaa Chartbeatin Bigboardista 23.1.2020.
Algoritmi ei päätä kaikesta
Journalismi ei kuitenkaan perustu tekoälyyn ja tietokoneisiin, vaan ihan oikeat ihmiset tekevät päätöksiä erilaisten sisältöjen näkyvyydestä. Esimerkiksi Yle.fi- sovellus ja verkkosivu ovat etusivutoimituksen koostamia.
Toimitus julkaisee sisällöt etusivulla ja seuraa, mikä kiinnostaa juuri nyt ja minkä jutun lukumäärät ovat jo laskussa. Näin toimitus voi reagoida parhaaksi näkemällään tavalla siihen, mitä ihmiset haluavat lukea.
Yle Uutiset voi toisinaan käyttää otsikkoja suunnitellessaan niin sanottua AB-testaamista. Juttuun laaditaan kolme vaihtoehtoista otsikkoa. Osa käyttäjistä näkee jutussa otsikon a, osa otsikon b ja osa otsikon c. Kun juttua on avattu tarpeeksi, datasta selviää, mikä otsikko oli sen nähneen yleisön mielestä kiinnostavin. Olet saattanut huomatakin tämän selatessasi uutisotsikoita. Päätös otsikosta tehdään siitä huolimatta toimituksessa ja otsikot muotoillaan journalistisin periaattein. Data auttaa valinnassa, mutta ihmiset tekevät lopulliset päätökset.

Suosittelupalvelut ovat kasvussa
Yle käyttää ja kehittää suosittelupalvelua. Se tarkoittaa, että algoritmi päättelee aiemmin käyttämäsi sisällön perusteella, millaiset jutut tai ohjelmat juuri sinua voisivat kiinnostaa. Esimerkiksi Ylen etusivulla oleva Luitko jo nämä? -artikkelit ovat sinulle suunnattuja eli lista ei ole kaikille käyttäjille samanlainen. Ylessä pyritään myös siihen, että käyttäjä voi törmätä yllättävään ja kiinnostavaan sisältöön, jota algoritmi ei aiempien katselujen perusteella ehkä suosittelisi. Yle pyrkii siis myös rajoittamaan algoritmiin perustuvia suositteluja.
Sovelluksissa voi vaikuttaa itse sisältöihin
Jos annat Uutisvahti-sovellukselle luvan käyttää sijaintitietojasi, palvelu etsii uutisia läheltä sinua, esimerkiksi mökkipaikkakunnaltasi. Voit myös valita, mitä aihealueita seuraat tai rajata kokonaan pois sellaisia, jotka eivät sinua kiinnosta.
Kuvavaihtoehdot suosittelijoina
Myös esimerkiksi Areena-sarjan esikatselukuva saattaa olla tekoälyn sinulle valitsema. Ajatus on, että eri kuvat vetoavat erilaisiin käyttäjiin. Näin myös seuraamme, miten erilaiset kuvat keräävät huomiota eri kohderyhmissä.

Ylen evästekäytännöt
Ylen evästekäytännöt muuttuivat maaliskuussa 2021. Yle luokittelee evästeet niiden käyttötarkoituksen mukaan ja alkaa soveltaa siihen perustuvaa tapaa evästekäytännöissään.
Käytännössä tämä tarkoittaa, että käyttäjän on hyväksyttävä evästeiden käyttö noin kaksi kertaa vuodessa. Jos käyttäjä on hyväksynyt vain osan evästeistä tai niiden luokitus muuttuu, käyttäjältä kysytään suostumusta noin kolmen kuukauden välein.
Evästeiden seuraaminen on jatkuvaa työtä, niitä saattaa tulla lisää, kun palveluissa käytetään uusia työkaluja tai ratkaisuja. Seuraamisella pyritään huolehtimaan, että palveluiden käyttäjän valintoja kunnioitetaan jatkuvasti.
Tämä muutos tapahtuu ensin yle.fi -nettisivuilla ja myöhemmin myös Ylen muissa palveluissa.
Ylen Tietosuoja-sivuston Evästekäytännöt-osiossa on tarkemmat tiedot evästeluokituksista ja luettelo kaikista Ylen käyttämistä evästeistä sekä niiden käyttötarkoitus.
Yle hyödyntää dataa oman toimintansa tueksi
Yle ei automaattisesti luovuta keräämäänsä dataa kenellekään ulkopuoliselle ilman käsittelyperustetta ja etukäteen sovittua käyttötarkoitusta. Jos dataa luovutetaan esimerkiksi tutkimuskäyttöön, käyttäjälle kerrotaan siitä.
Ylen palvelimille kertyy 5000 tapahtumaa joka ikinen minuutti. Tietoa siis liikkuu valtavasti. Ylelle data ei kuitenkaan ole liiketoimintaa, toisin kuin esimerkiksi Facebookille tai Googlelle.
Yle haluaa olla läsnä suomalaisten elämässä, joten se pyrkii henkilökohtaiseen palveluun. Tarkoitus ei ole seurata kenenkään toimintaa internetissä, vaan ymmärtää erilaisia yleisöjämme paremmin.
Lue lisää: Digitreenit: Mitä nettisivujen evästeet oikein tekevät? Onko ne pakko hyväksyä?
Edit: 28.1.2020 muutettu Yle Tunnusta koskeva tieto.
Edit: 28.1.2020 lisätty linkki Yle Uutisten artikkeliin.
Edit 28.1.2020 lisätty artikkelin omaa dataa.
Edit: 30.1.2020 vaihdettu artikkelin jakokuva.
Edit: 3.3.2020 jäädytetty liveseuranta ja lisätty kuvat tilanteesta.
Edit 24.3.2021 lisätty kappale Ylen evästekäytännöistä ja lisätty linkit Tietosuoja-sivustolle sekä sen evästeosioon.