Hyppää pääsisältöön

Eija Moisala ja Anne Hyvärilä: Uudella datalla parempaa palvelua ja ymmärrystä käyttökonteksteista

Ylessä on jo pitkään kehitetty uusia tapoja ymmärtää suomalaisten arkea paremmin. Tässä työssä laadulliset tutkimukset ja käyttäjätestit kulkevat rinnakkain analytiikan ja koneoppimisen kanssa. Olemme kehittäneet voimakkaasti analytiikkaa ja sen rikastamista eri tavoin, kuten iän ja sukupuolen mallintamisessa ja käyttömotiivien saralla.

Suomalaisten ymmärtäminen ei kuitenkaan yksinään riitä, vaan meidän pitää ymmärtää paremmin myös sisältöjä. Löysimme Ylen Data&AI -tiimiimme kumppaniksi Fourkindin, jonka kanssa olemme luoneet kokonaan uutta metadataa sisällöistä. Kun saamme syvempää tietoa sisällöistämme, ymmärrämme paremmin myös niitä käyttäviä suomalaisia. Datan avulla voimme kehittää palveluitamme verkossa, esimerkiksi osuvampia suositteluita.

Eija Moisala ja Anne Hyvärilä Ylen Älykäs data ja asiakkuus -tiimistä.

Mitä olemme tehneet?

Olemme rakentaneet mallin, ns. asiakasprofiilin, jossa luodaan uusia aihealueita lähes kaikille Ylen sisällöille. Ensin kaikki sisältö muutetaan tekstimuotoon – artikkelit hyödynnetään sellaisenaan, audiot muutetaan tekstilitteraatteiksi ja videoista käytetään tekstitykset. Lisäksi mukaan otetaan sisältöihin liittyvät asiasanat. Tästä kaikesta muodostuu yhteinen datamassa, joka mahdollistaa eri sisältötyyppien analysoimisen rinnakkain.

Raakateksti puhdistetaan eli esimerkiksi liian yleiset tai harvinaiset sanat poistetaan ja sanat perusmuotoistetaan. Tämän jälkeen etsitään yhden, kahden tai kolmen sanan pareja, joista muodostuu ns. piirteitä. Piirre voi olla vaikkapa “politiikka”, “Donald Trump” tai “hallitus viimeinen täysistunto”. Piirteistä etsitään abstrakteja semanttisia kokonaisuuksia, joita verrataan 25 000 yleisimmän piirteen varastoon. Koneoppimisen avulla voidaan hahmottaa, että vaikkapa “politiikka” kuuluu samaan kokonaisuuteen kuin “oikeusministeriö”. Kokonaisuuksia kutsumme tässä klustereiksi eli aihealueiksi.

Aihealueita voidaan rakentaa eri tasoille: kaikelle sisällölle, vain videoille tai vaikka vain yhdelle ohjelmatyypille, kuten ajankohtaisohjelmille. Aihealueiden avulla voimme tarkastella minkä tyyppisiä sisältöjä ihmiset käyttävät eri käyttökonteksteissa, eli eri kellonaikoina tai eri laitteilta, sekä minkälaiset aihealueet kiinnostavat eri-ikäisiä ihmisiä. Tietojen avulla voimme kehittää esimerkiksi sitä, milloin ja millaisia sisältöä Yle Areenasta tulisi löytyä.

Kuvassa kuvataan eri sisältöjä, laitteita ja vuorokaudenaikoja sekä eri ikäisiä käyttäjiä.
Aihealueiden käyttöä voidaan tarkastella monesta eri näkökulmasta. Kuvassa kuvataan eri sisältöjä, laitteita ja vuorokaudenaikoja sekä eri ikäisiä käyttäjiä. Kuva: Yle Yle,asiakkuus,käyttömotiivit

Miten aihealueita voi hyödyntää?

Aihealueita hyödynnetään eri tavoin, esimerkiksi Uutisvahdin mobiili-ilmoitusten kehittämisessä. Hyödyt näkyvät suoraan käyttäjille. Tulevaisuudessa tavoitteena on parantaa löydettävyyttä suosittelun avulla niin, että kiinnostavat sisällöt löytävät käyttäjänsä paremmin riippumatta siitä ovatko ne tekstiä, videota tai audiota.

Toimittajat ja muut sisällöntekijät voivat tarkastella aihealueiden käyttöä erilaisten datavisualisointien avulla. Aihealueita hyödynnetään myös kehitteillä olevassa toimittajan apurissa, ns. Onnibotissa, jonka avulla toimittaja löytää tekeillä olevan artikkelinsa aihe-alueesta kirjoitetut muut jutut. Onnibot luo myös ensimmäisen ennusteen siitä kuinka paljon artikkelia tullaan lukemaan.

Onnibotin kehitystöitä tehdään ketterästi yhteistyössä mm. Ylen News Labin ja Ylen uutistoimittajien kanssa. Kehitys tapahtuu monitilaajatiimeissä, joissa Uutisvahdin ilmoitusten tekemisessä ovat mukana mm. Fourkind ja Reaktor ja Onnibottia tehdään yhteistyössä Futuricen kanssa. Kumppanit työskentelevät osana Ylen Data&AI -tiimiä. Uusista kehitysaskelista Ylen tekijät tulevat kertomaan lisää myöhemmin.

Asiakasprofiili on esimerkki tekoälyn hyödyntämisestä arjen työssä. Tällaiset hankkeet auttavat meitä Ylellä parantamaan palvelujamme. Tekoäly on tärkeä ja välttämätön osa Ylen tulevaisuutta, jotta ihmiset löytävät heille merkitykselliset sisällöt valtavasta määrästä erilaisia artikkeleita ja ohjelmia.

Eija Moisala on Älykäs data ja asiakkuus -tiimin päällikkö sekä Ylen Data&AI -tiimin Business owner. Anne Hyvärilä on Älykäs data ja asiakkuus -tiimin Audience Insight Manager. Data&AI-tiimi on kymmenen hengen monitilaajatiimi, jossa on data scientisteja ja data engineereja kumppaneilta mm. Reaktorilta, Solitalta ja Fourkindilta. Data&AI -tiimin Product owner on Jaakko Lempinen.