Hyppää pääsisältöön

Timo Huovinen: Miten algoritmit ja koneoppiminen vaikuttavat journalismiin – millaista on niiden vastuullinen käyttö?

Kuvassa mies mustassa paidassa katsoo kameraan.
Kuvassa mies mustassa paidassa katsoo kameraan. Timo Huovinen

Journalistinen prosessi on muuttunut viime vuosina paljon. Kilpailu on koventunut, koska lehtien, tv:n ja radion rinnalle on tullut internet uutena julkaisuväylänä. Internetin “sisällä” sosiaalinen media on osaltaan perinteisen median julkaisuväylä, osaltaan perinteisen median kilpailija ja kilpailun koventaja.

Yhtenä vastauksena haasteisiin mediatoimialalla on alettu käyttää algoritmeja ja koneoppimista.

Algoritmien ja koneoppimisen käyttö vie yhteiskuntaamme eteenpäin. Myös journalismissa niitä kannattaa käyttää. Asiaa on pohtinut oivallisesti muun muassa Ylen verkkokehityksessä työskentelevä Jarno M. Koponen tässä artikkelissaan.

Algoritmien ja koneoppimisen hyödyntäminen on journalimissa kansainvälisesti yleistä.

Perinteisesti toimittamisen tehtävänä on pidetty tietojen keräämistä, varmentamista ja erittelyä sekä tämän esittämistä siinä julkaisumuodossa, jonka julkaisija on esittämiseensä valinnut. Journalismin kohteena ovat olleet median valitsemat aiheet.

Toimittamisen ydintä on se, että sen sisältöä koskevat ratkaisut on pyritty tekemään journalistisin perustein ja tätä päätösvaltaa ei ole saanut missään oloissa luovuttaa toimituksen ulkopuolelle. Tämä periaate todetaan suoraan suomalaistenkin Journalistin ohjeiden kohdassa 2.

Mutta miten toimittajat voisivat käyttää näitä uusia keinoja – esimerkiksi suosittelualgoritmejä ja koneoppimista – vastuullisesti, itse säätämiensä eettisten ohjeiden mukaisesti?

Algoritmit ja koneoppiminen vaikuttavat jo itse jutun tekemisessä

Algoritmit ovat läsnä toimittajan työssä jo jutuntekovaiheessa. Haemme tietoa yhä enemmän hakukoneiden avulla ja niiden toimintaa ohjaavat algoritmit. Hakutulos saattaa olla toimittajan kannalta “vääristynyt”, koska hakukoneen algoritmi määrittää, mitä haun tuloksena kullekin käyttäjälle näytetään.

Viime aikoina on käyty keskusteluja myös Googlen hankkeista, jotka ovat tulkittavissa sensuuriksi. Nämä asiat on hyvä muistaa juttua varten aineistoa hankittaessa. Siksi lähdekriittisyys, mahdollisimman alkuperäisille lähteille meneminen ja jutun monipuolinen lähteytys ovat edelleen tärkeitä toimittamisen perusperiaatteita. Olennaista tässä on se, että itse prosessi on toimittajan, ei esimerkiksi hakukoneen, määräysvallassa.

Toimittaja käyttää tietokonetta tiedonhankinnan apuna. Suurempien datamäärien rouhiminen ja niiden tuotokset ovat nousseet toimittamisen yhdeksi lähteeksi. Tässäkin data on hyvä apulainen, mutta siihen on suhtauduttava lähteenä yhtä kriittisesti kuin muihinkin toimittamisen lähteisiin.

Ylessä Voitto-robotti auttoi toimittajia jalkapallon MM-kisojen aikana tekemällä grafiikoita otteluista. Toimittajat saattoivat käyttää tätä grafiikkaa jutuissaan, mutta päätös siitä oli toimittajan. Tietokone voi auttaa toimitusta monenlaisessa tiedonhankinnassa mutta lopullinen päätös tiedon käyttämisestä jutussa on oltava toimituksella.

Tietokonetta voidaan käyttää myös faktojen tarkistuksen apuna.

Kone jutun haastattelijana

Keväällä 2018 kohistiin Googlen esittelemästä puhelusta, jossa tekoälyjärjestelmä varasi puhelimella kampaamoajan. Koneet pystyvät vastaisuudessa siis yhä enemmän myös tällaiseen.

Tästä tullaan pohdintaan, voiko kone tehdä toimitustyön haastatteluja? Ovathan jotkut julkisuudessa näkyvät haastattelut tulkittavissa niin yksinkertaisiksi, että konekin voisi ne tehdä.

Selkeä raja tässä menee minusta ihmisen suoran haastattelun teossa. Suoraa haastattelua ei pidä antaa koneen tehtäväksi, koska tällöin toimituksellista päätösvaltaa annettaisiin liikaa pois toimituksesta. Kone ei voi nimittäin ennakoida asioita samalla tavalla kuin ihminen. Journalistisessa suorassa haastattelussa on pystyttävä myös nopeasti havaitsemaan arvoasetelmia ja reagoimaan niihin.

Helppo vastaväite olisi, että voihan koneen ohjelmoida myös ennakoimaan. Sitähän kone tekee tuossa Googlen puhelussakin. Ja senkin ennakoinnin määreet voisi ihminen ja sitä kautta toimitus syöttää koneelle, jolloin toimituksellista määräysvaltaa ei olisi annettu pois.

Pidän suoran journalistisen haastattelun ennakointi- ja arvoasetelmien tunnistamistarvetta kuitenkin niin syvällisenä, ettei sitä voi antaa koneen tehtäväksi, vaikka kone olisi toimitukseen kuuluva toimituksen “oma” masiina. Tällainen haastattelu on toimittamisen ydintä ja se edellyttää sellaista vapaaseen tahtoon perustuvaa päätöksentekoa, jota koneella ei ole.

Entä sitten koneen tekemät “ei suorat” haastattelut osana jutun tiedonhankintaa? Tällainenkin tilanne saattaa tulla pohdittavaksi toimituksessa vastaisuudessa. Jos jutun tekeminen on lopulta toimituksen hallussa, voisiko koneen antaa tehdä tällaista työtä?

Tässäkin tapauksessa tarvitaan pohdintaa siitä, miten syvällisiä laitteen tekemät haastattelut jutun aineistoksi olisivat? Jos niiden tekemisessä ei olisi mukana ennakoiva ja arvottava ihminen, vääristyisivätkö haastattelut liikaa ja sitä kautta jutun lopputulos? Lopullinen ratkaisu tällaisessa tilanteessa riippuu yksittäisestä jutusta ja sen tiedonhankinnasta. Saattaahan hankittava tieto olla niin yksinkertaista, että ennakointitarve on minimaalinen tai sitä ei ole. Näin kone voisi tehdä haastattelun.

Algoritmeilla hankittava tieto jutun kantin ohjaajana

Median käyttödatan analyysi on yhä tärkeämpi osa mediatalojen ja toimitusten toimintaa. Hankittavaa tietoa ja sen analysointia käytetään paitsi itse suosittelualgoritmin parantamiseen myös parempien juttuaiheiden etsintään. Tällä tavoin kannattaa nykymaailmassa tehdä.

Näin saatava tieto juttujen menestyksestä algoritmien avulla saattaa helposti viedä juttujen aihevalintoja pelkästään kiinnostuksen suuntaan. On tärkeää tarkastella jutunaiheita myös muun kriteerin kuin kiinnostavuuden perusteella.

Juttuja tekevät robotit ovat eettisesti kimurantti asia

Journalismissa mennään erittäin kiinnostavalle alueelle, kun aletaan pohtia ennalta ohjelmoidun koneen tekemiä juttuja. Tekeehän Voitto-robotti uutisiakin jo Ylessä.

Niin pitkään, kun uutisia tekevä kone työskentelee toimituksen sille antamien ohjeiden ja aineiston varassa, on kone toimituksen kontrollissa oleva työväline, eikä toimituksellista päätösvaltaa ole annettu ulos toimituksesta. Näillä päätöksillä koneen toiminta on siis rajattu tarkasti. Julkaisupäätöksen sisältö on tällöin määrätty tiukasti jo ennen jutun varsinaista julkaisemista, samoin kuin monissa ihmisten tekemissä jutuissa. Näin on myös Voiton tapauksessa.

Ylellä Voitto-robotti (ruotsinkielisellä puolella Victoria-robotti) tekee tällä hetkellä yksinkertaisia juttuja urheilusta. Se on tehnyt myös yksinkertaista vaaliuutisointia. Kaikissa näissä tapauksissa robotti on tehnyt juttunsa etukäteen tarkkaan toimituksen sanelemalla tavalla ja sen käyttämä aineisto on ollut tiukasti määriteltyä sekä puhdasta. Esimerkiksi vaalitulosten tiedot ovat Suomessa hyvin suojattuja. Näillä perusteilla toimituksellista valtaa ei ole luovutettu ulospäin vaan Voitto on osa toimitusta.

Toimituksen on tietenkin valvottava koneen toimintaa ja myös sen käyttämän datan säilymistä puhtaana. Lukijan on selkeästi myös ymmärrettävä jutun allekirjoituksesta, että juttu on koneen tekemä.

Tilanne olisi toinen, mikäli kone toimisi itseoppivasti sekä jutun johtopäätösten että sen materiaalin hankinnassa. Tällöin aletaan lähestyä rajaa, jossa koneen voi tulkita toimivan toimituksen vallan ulkopuolella, eikä tämä olisi journalismin etiikan nykykäsityksen mukaan sallittua. Ylen Voitto-robotin käytössä tästä ei siis ole kyse.

Voitto-robotin toimintaperiaatteet löydät täältä.

Onko tällaisesta robotin käytöstä toimitustyössä sitten hyötyä jutun lukijoille?

Mikäli kone tekee yksinkertaisia juttuja edellä mainitulla eettisesti kestävällä tavalla ja tästä säästyvä työpanos suunnataan syvällisempiin juttuihin, ratkaisun voi katsoa hyödyttävän lukijaa. Koneen avulla voi myös laajentaa yksinkertaisten juttujen kirjoa ja näinkin lukija saa etua.

Algoritmit lukijoiden löytäjinä

Monien mediatalojen arkipäivää on nykyään käyttäjädatan kerääminen ja analyysi sekä suosittelualgoritmien käyttö. Käyttäjän toiminnan perusteella algoritmi suosittelee uutta lukemista, kuultavaa tai katsottavaa.

Algoritmien vaikutuksista on käyty laajaa keskustelua. On väitetty, että niiden avulla voi vaikuttaa myös epäterveesti demokraattiseen kehitykseen. Tämän vuoksi koneen käyttämät demokraattiseen päätöksentekoon vaikuttavat suosittelualgoritmit pitäisi laatia niin avoimesti, että tarvittaessa käyttäjä ymmärtäisi riittävästi kaavan toimintaperiaatteista. Tätäkin pohdittaessa kannattaa jälleen muistaa se, että koneen algoritmin laatii ihminen.

Mutta kuten Yle Areenan palvelupäällikkö Kari Haakana on todennut, tämä pitäisi tapahtua niin, ettei ulkopuolinen taho pääse tämän avoimuuden kautta käsiksi algoritmin kaavaan esimerkiksi vääristelläkseen sitä epäasiallisesti. Algoritmin laatija ei saa olla liian avoin laatimisen kaavaa paljastaessaan. Näin esimerkiksi median käyttämien algoritmien osalta tilanne on tasapainoilua luottamusta herättävän avoimuuden ja liiallisen hyväuskoisuuden välillä. Ja taas: algoritmin käyttäytyminen ja sille “annettava” data pitää olla toimituksen kontrollissa niin, ettei se johda arveluttaviin tuloksiin.

Suosittelualgoritmien on väitetty polarisoivan verkon käyttäjiä ja luovan sosiaalisen median käyttäjille oman näköisensä kuplan. Asiasta voi olla myös toista mieltä. Ylen Uutisvahtiinsa ohjelmoiman algorimin voi tulkita kaavan ansiosta lisänneen uutisten kokonaiskäyttöä ja esimerkiksi tiedeuutisten seurantaa.

Samoin Yle Areenan käyttämä uusittu suosittelu – etusivun suositeltava sisältö kootaan kaikesta Areenan sisällöstä aiemman toimituksellisen listan sijaan – on lisännyt sisällön kulutusta ja laajentanut katsottujen sisältöjen kirjoa. Lisää kuvausta Areenan algoritmista löydät täältä.

Suosittelualgoritmien käyttämisen tavoite on tehdä palvelusta jokaiselle henkilökohtaisesti hyödyllisempi. Ylen algoritmit hakevat käyttäjälleen vain aiheita, joita Yle on itse julkaissut. Tämä on toisin kuin esimerkiksi Facebookilla, jonka suosittelualgoritmi järjestää kaikkea Facebookissa julkaistua aineistoa.

Mikäli Ylen toimintaa pitää eettisesti kestävänä, on Ylen itse laatiman algoritmin järjestämä aineisto testattu toimittamisen eettisten ohjeiden pohjalta. Suositeltava aihe käynyt läpi jo julkaisuvaiheessa Ylen arvojen mukaisen seulan.

Ylen algoritmin suosittelemassa jutussa on usein erilaisia näkemyksiä aiheesta. Suosittelu voi myös tarjota luettavaksi juttua tai katsottavaksi aihetta, josta käyttäjä saattaa olla ennen sen näkemistä sisällöllisesti eri mieltä. Toimituksen päätökset uutisaiheiden painotuksista ohjaavat myös algoritmia.

Henkilötietojen keräämisessä Yle noudattaa EU:n tietosuoja-asetusta.

Kone on mukana myös kommenttien seulonnassa

Ohjelmoitua konetta käytetään toimituksissa apuna myös yleisöltä tulevien kommenttien valikoimisessa.

Suomessa tällaista aineistoa ei pidetä suoraan toimituksen laatimana. Onhan se siis yleisön, ei toimituksen laatimaa. Näin yleisökommentteja eivät myöskään koske suoraan Journalistin ohjeet vaan ohjeiden perässä oleva liite. Toimitukset ovat antaneet omia ohjeitaan juttujensa yhteydessä käytävälle keskustelulle. Ylen ohjeet löytyvät täältä.

Yle on alkanut käyttää laitetta myös yleisöltä tulevien kommenttien tarkistamiseen. Toimituksen opettama tietokone moderoi keskustelua: se päättää itsenäisesti, onko kommentti sellainen, että sen voi julkaista vai pitääkö se hylätä.

Kone siirtää hylätyt ja epävarmat tapaukset toimittajan katsottavaksi. Toimittaja käy myös säännöllisesti läpi koneen tekemiä päätöksiä ja muuttaa niitä tarvittaessa.

Laite hoitaa tällä hetkellä noin 90 prosenttia kaikista kommentteihin liittyvistä päätöksistä itsenäisesti ja noin 10 prosenttiin se kutsuu ihmisen erikseen tarkistamaan tilanteen. Nämä ovat sellaisia, joista kone tietää olevansa kohtuullisen epävarma.

Tämä käytäntö ei ole tietenkään millään tavalla poistanut toimituksen mahdollisuutta puuttua keskusteluun sen jokaisessa vaiheessa. Ylen toimitus tarkkailee koko ajan koneen toimintaa ja sitä, että se noudattaa toimituksen linjaa.

Kokemukset uudesta käytännöstä ovat olleet hyviä ja sitä on laajennettu. Myös keskustelun taso Ylen sivuilla on kohonnut.

Lisää tietoa kommentoinnin moderoinnista löydät täältä.

Hyvä renki mutta huono isäntä

Kaiken kaikkiaan algoritmit ja koneoppiminen ovat toimittamisessa hieno asia ja niiden käyttöä kannattaa viedä journalismissa eteenpäin. Pitää kuitenkin muistaa vanha ja kulunutkin ajatus: algoritmit ja opetettu tietokone ovat hyvä renki mutta huono isäntä. Datalla ei ole myöskään etiikkaa, se tulee ihmiseltä.

Toimittajien yhteisö on eettisissä säännöissään halunnut pitää viimeisen vallan journalismin päätöksistä toimituksella. Sitä ajatusta on myös Ylessä noudatettu.

Yhä itseoppivammat laitteet haastavat pian tämän ajatuksen myös journalismissa ja siinä rajanvedossa kannattaa olla tarkkana. Riittävän itseoppivat masiinat eivät nimittäin ajattele vapaasti. Ne eivät tahdo asioiden oikeudenmukaisuutta, kohtuutta, reiluutta tai vääryyttä. Tämän vuoksi on tärkeää, että nämä asiat jäävät lopulta ihmisen päätettäväksi, hyvässä ja pahassa. Siksi toimituksessa tarvitaan edelleen toimittajia ja heidän viimekätistä päätösvaltaa asioihin.

Muuten tekoäly ajaa ihmisen ohi kontrolloimattomasti myös toimituksissa.

Timo Huovinen
Journalististen standardien ja etiikan päällikkö

Kiitokset kommenteista, haastamisesta sekä ideoista Ylen Aleksi Rossille, Kari Haakanalle, Jarno M. Koposelle, Aki Kekäläiselle, Tuija Aallolle, Tuomo Björkstenille, Jukka Nivalle, Kalle Pirhoselle, Jarkko Ryynäselle, Kirsi-Marja Okkoselle, Marja Niemelle, Ismo Silvolle ja Jaakko Lempiselle.

Ajatuksia kirjoitukseen ovat antaneet mm. siihen merkittyjen suorien linkkien ja niiden takaa löytyvän aineiston lisäksi ainakin kirjat “Datajournalismin työkäytännöt”, Turo Uskali ja Heikki Kuutti sekä “Homo Deus”, Yuval Noah Harari ja Andrew Cochranin ja Paul Chadwickin median yleisöasiahenkilöiden konferenssissa pitämä luento tekoälystä ja journalismista kesäkuussa 2018.

Juttuun lisätty 10.10.2018 Yle Areenaan ja kommentointiin liittyvät linkit:
https://yle.fi/aihe/artikkeli/2018/10/09/suosittelu-ohjaa-kiinnostavan-sisallon-pariin
https://newslab.yle.fi/#/blog/4J47jSjCDYy80gIUswosGk

Kommentointi sulkeutuu 26.10.
Kommentit

Lue myös - yle.fi:stä poimittua