Hyppää pääsisältöön

Suomelle teknologinen etulyöntiasema puhepankin avulla? Useat suomalaisyritykset ovat jo mukana ainutlaatuisessa puheenkeruussa

Talvinen maisema, jossa kännykän ruudussa näkyy sääennustejuttu
Talvinen maisema, jossa kännykän ruudussa näkyy sääennustejuttu Kuva: Maxim Potkin, Unsplash / Annukka Palmén-Väisänen Lahjoita puhetta

Lahjoita puhetta -hankkeen tavoitteena on pitää suomen kieli mukana teknologisessa kehityksessä ja tulevaisuuden palveluissa. Sitä varten puhetta tarvitaan kaikenlaisilta ja -ikäisiltä ihmisiltä. Hanke on kansainvälisestikin vertailtuna poikkeuksellinen. Myös monet yritykset, kuten If, IBM ja Microsoft, ovat lähteneet mukaan kampanjaan antamalla työntekijöilleen mahdollisuuden lahjoittaa puhetta työajalla.

Lahjoita puhetta -hankkeessa on puolen vuoden ajan kerätty tavallisten ihmisten arkipuhetta tutkijoille ja sovelluskehittäjille.

Kyseessä on kansainvälisestikin vertailtuna poikkeuksellinen hanke, jonka tavoitteena on säilyttää suomen kieli mukana nopeasti etenevässä teknologisessa kehityksessä.

Aalto-yliopiston professorin ja puheentunnistusteknologioiden tutkijan Mikko Kurimon mukaan hanke on tärkeä etenkin tulevaisuuden näkökulmasta, kun puheentunnistusteknologian käyttö palveluissa ja esimerkiksi kännykällä tulee väistämättä lisääntymään – aivan kuten puhelimien kosketusnäytötkin aikanaan.

Jos laadukasta dataa ei kerätä suomen kielellä, vaarana on, että puheella toimivat palvelut eivät ymmärrä suomea yhtä hyvin kuin muita kieliä.

– Vaihtoehtona voi tulevaisuudessa olla hyvä englanninkielinen tai huono suomenkielinen automaattipalvelu, Kurimo sanoo.

– Kun nykyisin töissä olevat tulevat vanhoiksi, esimerkiksi kännykän kosketusnäytön käyttö, jossa tarvitaan näppärien sormien lisäksi tarkkaa näköä sekä hyvää katseen ja koordinaatiota, ei ehkä suju enää niin hyvin. Silloin olisi hyvä pystyä ohjaamaan toimintoja myös puhumalla.

Jotta tulevaisuuden palvelut helpottaisivat arkea ja toimisivat sujuvasti kaikille, pohjalle tarvitaan eri-ikäisten ja eri tavoin puhuvien henkilöiden puhetta.

Etulyöntiasema tutkimukselle ja suomalaisille yrityksille

Lahjoita puhetta -hankkeeseen puhetta kerätään vapaaehtoisesti, anonyymisti ja mahdollisimman monipuolisesti erilaisilta puhujilta: lapsilta, vanhuksilta, suomea toisena kielenään puhuvilta ja niin edelleen.

Mikko Kurimon mukaan suomen kieli poikkeaa rakenteellisesti valtakielistä. Siksi on tärkeää, että hankkeen avulla rakennetaan nyt laajaa kotimaista puhepankkia, jonka resurssit ovat myös pienten ja kotimaistenkin yrityksien käytössä Helsingin yliopiston ylläpitämän Kielipankin kautta.

Jos saisimme tässä hankkeessa yli 5 000 tuntia kokoon, se herättäisi jo kansainvälistä huomiota.― Mikko Kurimo

Kurimon mukaan hanke on kansainvälisestikin vertailtuna pioneeritason luokkaa, sillä näin laajoja ihmisten arkipuhetta kerääviä ja koko yhteiskunnan hyödynnettäväksi tulevia hankkeita ei maailmalla juuri ole.

– Jos saisimme tässä hankkeessa yli 5 000 tuntia kokoon, se herättäisi jo kansainvälistä huomiota. Jopa niin, että yritykset kiinnostuisivat kehittämään sovelluksia suomen kielellä, Kurimo sanoo.

– Meillä on Suomessa alan huippututkimusta valmiiksi, mutta ilman dataa ei saada kattavasti toimivaa suomenkielistä puheentunnistusta. Jos meillä olisi kattava aineisto koossa, se veisi myös tutkimusta eteenpäin ja antaisi suomalaisille yrityksille etulyöntiaseman.

Tämä voisi omalta osaltaan auttaa uusien työpaikkojen luomisessa niiden tilalle, jotka tulevat teknologisen kehityksen myötä häviämään tulevaisuudessa.

Monet yritykset ovat lähteneet hankkeeseen innolla mukaan antamalla työntekijöilleen mahdollisuuden lahjoittaa puhetta työajalla. Vakuutusyhtiö If oli ensimmäisten joukossa.

Olemme antaneet henkilökunnallemme luvan käyttää aikaa oman puheensa lahjoittamiseen.― Peter Valjakka

– Olemme pitkään kehittäneet tekoälyyn perustuvaa chatbottia ja tehneet myös yhteistyötä yliopistojen kanssa tekstimuotoisen suomen kielen ymmärtämiseksi tekoälyllä, mutta puhutun kielen ymmärtämiseksi tiedeyhteisöltä on puuttunut tarvittava laaja näytemateriaali, Suomen Ifin asiakaspalvelukeskuksen liiketoiminnan kehitysjohtaja Peter Valjakka kertoo.

– Asian korjaamiseksi halusimme Ifissä osallistua tällaiseen yhteiskunnallisesti merkittävään kehityshankkeeseen ja annoimme henkilökunnallemme luvan käyttää aikaa oman puheensa lahjoittamiseen. Uskomme, että sitä mukaa, kun tekoälyn kyky ymmärtää puhuttua suomen kieltä tulee paremmaksi, me pystymme myös kehittämään ratkaisuja, joilla voimme palvella asiakkaitamme paremmin.

Isoista yrityksistä mukana kampanjan yrityshaasteessa ovat Ifin lisäksi muun muassa Microsoft ja IBM. Lisäksi mukana on iso joukko pienempiä yrityksiä ja toimijoita, joille puhepankki tarjoaa uudenlaisia mahdollisuuksia.

Kone, ymmärrä minua oikein!

Kielitieteilijä ja Helsingin yliopiston digitaalisten ihmistieteiden osastolla projektisuunnittelijana toimiva Mietta Lennes uskoo Mikko Kurimon tavoin, että kattavasta puheaineistosta olisi suurta hyötyä niin suomalaisille yrityksille ja kuin palveluiden käyttäjille.

Teknisissä palveluissa on oleellista, että laite ymmärtää suomea siten kuin sitä oikeasti puhutaan.― Mietta Lennes

– Suomi on sen verran vireä kielialue, että kielen kuolemaa ei ole odotettavissa, mutta teknisissä palveluissa on oleellista, että laite ymmärtää suomea siten kuin sitä oikeasti puhutaan, Lennes sanoo.

– Tällä hetkellä koneiden kanssa ei varsinaisesti voi jutella. Pikemminkin niille voi yrittää sanella tekstiä ja toivoa, että menee oikein. Normaalissa keskustelussa ihmisten puhetyyli on täysin erilainen, koska he ilmaisevat ja tulkitsevat keskenään tehokkaasti monia asioita, joille tietokoneen näppäimistöllä ei edes ole kirjainmerkkejä.

Kyse ei siis Lenneksen mukaan ole vain sanastosta, vaan puheen sävelkulusta, rytmistä ja painotuksista, jotka voivat muuttaa koko ilmauksen merkityksen toiseksi.

– Kun koneita ohjataan puheella, niiden täytyy mukautua puhujan äänenpainoihin, oli tämä sitten turkulainen, savolainen, maahanmuuttaja, lapsi, vanhus, terve, sairas, kiireinen tai pitkästynyt, Lennes jatkaa.
Jos puhetta saadaan kerättyä kasaan riittävän suuri määrä erilaisilta puhujilta, automaattisen puheentunnistuksen toimintaa voitaisiin merkittävästi parantaa.

– Tämä on suomalaisten ja suomea puhuvien etu. Annamme yrityksille mahdollisuuden kehittää puheentunnistusta kotimaisin voimin ja kielentutkijat saavat käyttöönsä laajan, nykyhetkeä vastaavan puheaineiston eri puolilta Suomea, Lennes sanoo.

Haluatko lahjoittaa puhettasi?

Kuvassa tummaihoinen tyttö katsoo kännykkää.
Kuvassa tummaihoinen tyttö katsoo kännykkää. Kuva: Andrea Piacquadio Lahjoita puhetta

Se onnistuu tästä. Pienikin panos riittää! Jokainen minuutti on suomen kielen kannalta tärkeä! Lisätietoja hankkeesta löydät sivuiltamme yle.fi/lahjoitapuhetta. Olemme koonneet puheenlahjoituskoneeseen myös opettajille paketin, jota voi käyttää mediataitojen opetuksisssa peruskouluissa ja lukioissa. Eri vuosiluokille tehdyt mediataitopaketit löytyvät lsuoraan lahjoituskoneesta.

Jos haluat yrityksesi tai organisaatiosi mukaan yrityshaasteeseen, ohjeet aukeavat alla olevasta plussasta.

Näin osallistut Lahjoita puhetta -kampanjan yrityshaasteeseen!

  • Mieti yrityksellesi oma tunniste. Se voi olla esimerkiksi #yrityksennimipuhuu
  • Viesti yrityksesi sisällä asiasta hyvin ja muistuta osallistujia lisäämään teidän oma tunniste metatietoihin.
  • Tunnistetta kysytään kohdassa “Osallistutko yrityshaasteeseen”. Tämä metatietokenttä ei ole heti alussa, vaan tulee eteen tehtäviä tehtäessä (kuva kentästä alla).
  • Puheenlahjoituskone löytyy osoitteesta lahjoitapuhetta.fi. Se on saatavana myös iOSille ja androidille sovelluskaupasta.
  • Lahjoituskone ohjaa osallistujaa puhumaan eri teemojen kautta. Puhetta voi lahjoittaa yhden minuutin tai vaikka 20, ja määrä riippuu kustakin puhujasta ja hänen sisäisestä Runebergistään. Voitte kuitenkin ohjeistaa työntekijöillenne, kuinka kauan he saavat käyttää aikaa puheenlahjoitukseen.
Osallistutko yrityshaasteeseen
Osallistutko yrityshaasteeseen Lahjoita puhetta

Lahjoita puhetta -hanke on Valtion Kehitysyhtiö Vaken, Helsingin yliopiston ja Yleisradion yhdessä vetämä hanke.

Graafinen kuva: Ihmishahmoja "yhtenä tiiminä".
Graafinen kuva: Ihmishahmoja "yhtenä tiiminä". Kuva: Annukka Palmén-Väisänen / Yle Lahjoita puhetta

Muokkaus 22.11. klo 9.44: Lisätty loppuun lause hankkeen vetäjistä.

Lue myös - yle.fi:stä poimittua