Hyppää pääsisältöön

Jaakko Lempinen: Autonominen tekoäly auttaa kasvattamaan Yle Areenan sisältöjen kulutusta

Jaakko Lempisen potretti
Jaakko Lempisen potretti Kuva: Ilmari Fabritius / Yle Yle,jaakko lempinen

Yle Areena on yksi ainoista suoratoistopalveluista maailmassa, joka pystyy pistämään kampoihin Netflixin laajentumiselle. Yksi syy sille, mahdottoman laajan sisältötarjonnan lisäksi, on tietenkin myös Areenan palvelukokemus.

Tämän palvelukokemuksen kehittämisessä henkilökohtaisempaan suuntaan on käytetty apuna tekoälyä jo hyvän aikaa. Tässä blogitekstissä esittelen viimeisintä suosittelun kehitysvaihetta, jonka avulla onnistuttiin parantamaan tiettyjen ohjelmien kohdalla katseluminuutteja +4 % verrattuna normaaliin palvelun käyttöön.

Jo jonkin aikaa on tiedetty, että pelkkä ohjelman nimi ei ole ainoa tarvittava kimmoke aloittaa sisältöjen katselu ja kuuntelu Areenassa, vaan mukaan tarvitaan myös juuri oikeaan hetkeen sopiva visuaalinen ärsyke eli sisältöä esittävä kuva.

Me ihmiset kiinnitämme ensisijassa huomiomme kuviin. Meidät on suunniteltu niin, että visuaalinen esitystapa on meille luonnollinen ja useissa tutkimuksissa onkin todettu, että pelkästään kuvilla on iso merkitys niin sisällön kuluttamiseen kuin ylipäätään palvelun käyttöön.

Sisältöjä on kuitenkin Ylellä niin paljon, ettei yksittäisten ohjelmien erilaisten kuvavaihtoehtojen ihmisvoimin tehtävä kokeilu ole mahdollista tai edes mielekästä. Lisähaasteena on se, että me pidämme erilaisista kuvista. Toinen voi pitää tiettyä ohjelmaa parhaiten esittävästä maisemakuvasta, toinen taas tarvitsee eteensä päähenkilön lähikuvassa.

Esimerkiksi kumpi näistä kuvista herättää sinussa enemmän kiinnostusta?

Sorjonen sarjasta mies ja nainen seisovat selkä vastakkain.
Vaihtoehto 1 Sorjonen sarjasta mies ja nainen seisovat selkä vastakkain. Kuva: Yle Sorjonen
Sorjonen halaa tyttöä.
Vaihtoehto 2 Sorjonen halaa tyttöä. Kuva: Yle Sorjonen

Jos vaihtoehto 1 on enemmän mieleesi ja satut olemaan 30–45-vuotias mies, niin edustat sitä oman ikäryhmäsi Areena-käyttäjien joukkoa, jolle tuo kuva on kaikkein sopivin. Tämä johtaa myös kaikkein todennäköisemmin Sorjosen katseluun ko. kohderyhmässä, kun vaikka vaihtoehto 2, joka taas toimii 25 % paremmin 30–45-vuotiaille naisille.

Lähdimme Areenan kasvutiimin ja Data&AI-tiimin yhteistyöllä testaamaan Areenassa autonomista tekoälyä, jonka tarkoituksena on saada asiakkaat löytämään sisällön pariin entistä helpommin personoimalla ohjelmasisältöjen kuvia. Tavoitteeksi otimme +2 % kulutuksen kokonaiskasvun verrattuna vakiokuviin testatuilla ohjelmilla.

Kyseessä ei kuitenkaan ollut aivan perinteinen A/B testaus, missä valitaan erikseen mitä testataan milläkin määrillä ja millä ehdoin, vaan ennemminkin autonominen prosessi, jossa koneelle annetaan käyttöön tieto asiakkaiden profiileista, käyttötilanteista tai konteksteista sekä kyky toteuttaa autonomisesti eksploraatiota sisältöä kuvaavien kuvien ja käyttäjien välillä.

Koneen on siis valittava ilman erikseen annettuja ohjeita jokaiseen tilanteeseen sopiva ja jokaiselle käyttäjälle kussakin tilanteessa parhaiten sisältöä esittelevä kuva.

Ratkaisu tehtävään ei ole täysin itsestään selvä, koska tietokonetta on vaikea opettaa ymmärtämään, mitä ohjelmia esittävissä kuvissa on ja toisaalta jokaisella sisällöllä on omat kuvavariaationsa, eikä eri sisältöjen välisillä kuvavalinnoilla ole välttämättä mitään yhteyttä toisiinsa. Lisäksi, koska palvelun nopeus on suoraan verrannollinen käyttökokemukseen, on kiinnitettävä huomiota siihen, kuinka nopeasti tällaista kuvien personointia voidaan tehdä Areenan kokoisten palveluiden asiakas- ja sisältömäärillä. Areenan etusivulla vieraillaan reilusti yli puoli miljoonaa kertaa joka päivä.

Näiden lähtöoletusten pohjalta kokeilimme sisältökohtaista bandit-mallia, jossa ratkaisu esitetään vaihtoehtojen kontekstuaalisena optimointiongelmana. Jokainen sisältö on oma mallinsa, jolla on omat kuvavaihtoehtonsa, joita malli voi kokeilla erilaisille käyttäjille, erilaisissa konteksteissa – esimerkiksi eri kuva eri käyttäjälle eri viikonpäivänä eri kellonaikana eri laitteille jne. Parhaimmillaan tätä optimointia tehdään useita kymmeniä tuhansia kertoja minuutissa.

Pelkästään kuvia muuttamalla Areenan palvelukokemus tuntuu huomattavasti erilaiselta, vaikka ohjelmasisältö on tismalleen sama.

Vai mitä itse sanot näistä kahdesta etusivusta, joissa on samat ohjelmat, mutta eri kuvat:

Yle Areenan etusivu
Käyttäjä A:n Areenan etusivu satunnaisena ajanhetkenä Yle Areenan etusivu Kuva: Yle Yle Areena,etusivu
Yle Areenan etusivu
Käyttäjä B:n Areenan etusivu satunnaisena ajanhetkenä Yle Areenan etusivu Kuva: Yle Yle Areena,etusivu

Areena-kuvien optimointi kasvattaa sisällössä vietettyä aikaa

Optimointi perustetaan minuutteihin: mitä enemmän sisällön parissa vietettyjä minuutteja valittu vaihtoehto saa aikaan, sitä enemmän kuvaa käytetään siinä konteksteissa missä minuutit syntyivät eri käyttäjäprofiileille. Tähän mennessä tehdyt kokeet ovat erityisen lupaavia.

Kun verrataan kuvavaihtoehdoilla personoituja sisältöjä A/B-testissä niiden vakiokuvia vastaan, minuutit nousevat personoinnilla +2.3 % ja konversio (katselun aloittaneet/sisällön nähneet) parantui +4.8 %.

Areenan mittaluokassa tällaiset parannukset ovat merkittäviä – viettäähän palvelussa keskimäärin jokainen suomalainen noin tunnin viikossa.

Samoin on mielenkiintoista huomata, että jos olisi haettu perinteisin A/B-testaamisen menetelmin parhaiten toimivaa kuvaa, olisi kuvien tehoista menetetty iso osa, koska katselu jakaantui eri kuville tasaisesti yli kaikkien kohderyhmien.

Sorjonen-ohjelman kuvien katseluminuutit naisilla ja miehillä eri ikäryhmissä, pylväät
Sorjonen-ohjelman katseluminuutit personoiduilla kuvavaihtoehdoilla sukupuolen ja iän mukaan. Sorjonen-ohjelman kuvien katseluminuutit naisilla ja miehillä eri ikäryhmissä, pylväät Kuva: Yle katselutottumukset,Yle Areena

Isoin hyöty syntyy kuitenkin siitä, että opimme tekemään tarkempia kuvavariaatioita oikeille kohderyhmille. Mallin tekemistä valinnoista voidaan jälkeenpäin päätellä millaiset kuvat toimivat missäkin konteksteissa parhaiten ja miten kuvien tuotantoa pitäisi jatkossa kehittää, jotta niiden kokonaislaatu kasvaisi. Tämä parantaa palvelun käyttökokemusta entisestään ja personointi voidaan toteuttaa jatkuvasti parantuvalla kuvamateriaalilla.

Kokeilun hyödyt eivät luonnollisesti jää vain Areenaan. Samalla ideologialla voidaan optimoida mitä tahansa ongelmaa, joka voidaan esittää vaihtoehtojen optimointiongelmana. Olkoot kyseessä otsikot, sisältökuvat, ingressit, käyttöliittymän valikoiden sijainti jne. Näin käyttäjät ja kulloinenkin käyttökonteksti voidaan ottaa huomioon, ja valjastaa personoinnin laajamittaiset hyödyt käyttöön kaikissa mahdollisissa tilanteissa. Kysymys on myös arvoista: mitkä asiat voidaan personoida ja mitkä kokemukset ovat henkilökohtaisia?

Työ palveluiden parantamisen kanssa jatkuu, ja on varmaa, että koneoppimisella ja tekoälyllä on jatkossakin siinä iso rooli. Ylen Data&AI -tiimissä on myös määritelty eettiset pelisäännöt, joiden puitteissa kaikkea tekoälyyn ja data-palveluiden kehitykseen liittyvää työtä tehdään.

Jaakko Lempinen
Data&AI PO
jaakko.lempinen@yle.fi

Kuvien henkilökohtaistamista olivat rakentamassa Ylen Data & AI- ja Areenan kasvutiimin kanssa Jarno Kartela Fourkind, Anahit Pogosova Solita sekä Tommi Sinivuo Wunderdog.

Data & AI -tiimin vastuulla ovat Ylen asiakas- ja sisältödatan keräämiseen ja prosessointiin liittyvät tehtävät sekä tekoälyn avulla tuotetut automaatiojärjestelmät eli tutummin esimerkiksi sisältöjen suosittelujärjestelmät, jotka esittelevät algoritmipohjaisesti käyttäjille sisältöä esimerkiksi verkon striimauspalveluissa. Lisäksi 13-hengen tiimi rakentaa asiakasdatan visualisointiin liittyviä palveluita.

Lue myös - yle.fi:stä poimittua