Ylen artikkelien data tutkijoiden ja kehittäjien käyttöön

Yle avaa artikkeleidensa tekstisisältöjä tekoälyn ja koneoppimisen kehittämiseen.

algoritmit
tietokoneen edessä silmälasit johon heijastuneena tekstiä
AOP

Ylen julkaisemien artikkelien sisältämä data avataan suomalaistutkijoiden ja -kehittäjien käyttöön. Tekstipohjaista materiaalia voi käyttää esimerkiksi tekoälyn opettamiseen.

Ylen tuotantojohtaja Janne Yli-Äyhö kuvailee nyt avattua datamäärää mittavaksi.

– Tekoäly tarvitsee materiaalia oppiakseen ja meillä sitä materiaalia on paljon, joten tietenkin haluamme tarjota sitä kehittäjille, Yli-Äyhö sanoo.

Datan perusteella tutkijat ja kehittäjät voivat rakentaa esimerkiksi algoritmeja suomen kielen ymmärtämiseen. Kyse on siis eräänlaisesta oppimateriaalista koneille.

Yksi kehityskohde on ääniohjaus, joka on vielä suomen kielellä kehitysasteella. Datan avulla kone oppii tunnistamaan sisältöjen lisäksi muun muassa konteksteja.

Ensimmänen avattu datapaketti on Ylen tekstiartikkeleista johdettu eräänlainen sanakirja. Se ja myöhemmin avattavat datat löytyvät Ylen kehittäjäsivuilta (siirryt toiseen palveluun).