1. yle.fi
  2. Uutiset
  3. puheentunnistus

Savolainen, kainuulainen ja oululainen yrittivät puhua Sirille, mutta turhaan – katso videolta, kuinka vaikeita murteet ovat tekoälylle

Suomenkielinen puheentunnistus laahaa vielä reilusti muiden kielien perässä, mutta tilannetta yritetään muuttaa.

puheentunnistus
Antti-Pekka Vepsäläinen.
Savon murretta puhuva Antti-Pekka Vepsäläinen ja kaksi muuta suomalaista testasivat, kuinka Siri ymmärtää heidän puhettaan. Katso videolta, miten kävi!

Tekoälyyn ja puheentunnistamiseen perustuvat palvelut ovat nykyaikaa, mutta suomea ne eivät juuri ymmärrä. Erityisen vaikeaa tekoälylle on ymmärtää suomen kielen murteita. Teknologian kehittyessä suomalaisenkin puheen ymmärtäminen on koko ajan tärkeämpää.

– Kaikki palvelut ovat ennen pitkää puheella saavutettavissa. On hyvä, että asioita voi toimittaa omalla kielellään, Helsingin yliopiston fonetiikan professori Martti Vainio sanoo.

Tällä hetkellä tutuista puheentunnistuksen sovelluksista ainoastaan Applen Siri ymmärtää suomea keskustelussa. Google puolestaan lisää mahdollisuuksia puheentunnistukseen koko ajan myös suomeksi. Ihan helppoa se ei ole, vaikka tekoäly osaisikin jo kääntää puhutut sanat tekstiksi. Puheen merkityksen ymmärtämiseksi tekoälyn pitää osata muun muassa kielioppia, joka suomessa on suhteellisen vaikeaa.

Suomenkieliset palvelut laahaavat perässä, koska se on isoille yrityksille pieni markkina-alue.

Tällä hetkellä puheentunnistus on ehkä näkyvimmin esillä älypuhelimissa ja älykaiuttimissa, mutta sitä käytetään jo muun muassa lääkärien sanelujen tallentamisessa sekä asiakaspalvelupuhelimissa. Tulevaisuudessa näitä palveluja on vielä enemmän.

– On paljon esimerkkejä, joita emme osaa vielä ajatellakaan, Solita Oy:n teknologia-asiantuntija Sami Köykkä sanoo.

Suomalaisen puheentunnistuksen avuksi on käynnistetty Lahjoita puhetta -projekti. Kyseessä on Valtion kehitysyhtiö VAKEn, Helsingin yliopiston, Ylen ja Solita Oy:n yhteisprojekti, jossa on tarkoitus kerätä 10 000 tuntia suomalaisten puhetta.

Haastoimme kolme suomalaista lahjoittamaan murteellista puhettaan ja samalla juttelimme siitä, miten tärkeää oma murre on. Voit katsoa nauruntäyteisen videon klikkaamalla jutun pääkuvaa.

Kun puhelahjoituksia on tarpeeksi, ne kootaan yhteen ja niistä muodostuu materiaalipankki, jota mikä tahansa yritys voi pyytää käyttöönsä. Materiaali voi siis jouduttaa teköälyn suomen kielen oppimista. Päätarkoitus on tarjota materiaalia suomalaisille yrityksille, jotka tuottavat suomalaisia hyödyttäviä palveluita.

– Tämä antaa suomalaisille pienemmille yrityksille kyvyn kilpailla vaikka Googlen ja Applen kanssa, Vainio sanoo.

Lahjoita puhetta -kampanjaan on kerätty tällä hetkellä vasta noin 1 500 tuntia puhetta, joten lisää tarvitaan. Suhteutettuna asukaslukuun eniten puhetta on saatu Etelä-Karjalasta ja Kainuusta, vähiten edustettuna ovat Pirkanmaa, Uusimaa ja Pohjanmaa. Puhetta halutaan kerätä lahjoituksena. Suuret yhtiöt kuten Apple ja Google keräävät dataa kuuntelemalla asiakkaidensa laitteita, luvan kanssa tai joskus jopa ilman lupaa.

– Halusimme lähteä liikkeelle avoimemmin ja reilummalla meiningillä. Meillä ei ole tarvetta salakuunnella ketään, Köykkä sanoo.

Mikäli suomen kielen murteita ei pystyttäisi käyttämään puheentunnistuspalveluissa, on mahdollista, että se vähentäisi murteen puhumista entisestään. Professori Martti Vainion mukaan ihminen mukauttaa puhettaan helposti silloin, kun on pakko.

– On hyvä lähtökohta, että teknologiaa pystytään kehittämään niin, ettei se pakota ihmistä mukautumaan liikaa.

Mitä murre merkitsee sinulle? Entä kuinka tärkeää on, että tekoäly ymmärtäisi sinunkin murrettasi? Voit kommentoida 16.8 kello 23:een saakka.

*Lue seuraavaksi:
*
Oletko kallellasi savolaisiin, hämäläisiin vai kenties eteläpohjalaisiin murteisiin? Selvitä murre-DNA:si!

Lahjoita puhetta -projektin nettisivut

Lue seuraavaksi