Mistä Helsingissä saa hyviä karjalanpiirakoita? Esitän hyvinvointini kannalta olennaisen kysymyksen Googlen Assistant-palvelulle, jonka uusimpia ominaisuuksia Google esittelee kymmenistä maista tulleille toimittajille Zürichissä.
Hetkessä palvelu on muuttanut puheeni tekstiksi ja googlannut vastauksen. Myös norjalainen kollegani kokeilee kysymysten esittämistä äidinkielellään ja saa häntä tyydyttävät vastaukset. Pyydän ympärillä olevaa väkeä aloittamaan monikielisen pölinän, mutta puheentunnistus näyttää selviävän myös taustamelusta – ainakin englanniksi. Google aikoo selvästi haastaa Microsoftin, Applen ja Amazonin puhetta tunnistavat sovellukset.
Nimenomaan erilaiset puhujat, rakenteeltaan erilaiset kielet ja taustahäly ovat olleet puheentunnistuksen kompastuskiviä. Näistä ongelmista on päästy yli vasta hiljattain, sanoo Googlen tekoälytutkija Greg Corrado.
– Aikaisemmin järjestelmä ei tunnistanut harvinaisempia kieliä tai edes edes tavallisimpia kieliä, jos ihmisellä oli aksentti. Nämä asiat ovat korjaantuneet aivan parin viime vuoden aikana, hän sanoo.
Myös puheentunnistusta yli 20 vuotta tutkinut professori Mikko Kurimo Aalto-yliopistosta puhuu alan läpimurrosta. Esimerkiksi kännykkäsovellukset yksinkertaisesti toimivat.
Syynä murrokseen ovat hänen mukaansa tutkijoiden kehittämät entistä paremmat laskenta-, äänne- ja kielimallit sekä tietokoneiden laskentatehon kasvu.
Googlen puheentunnistuksen teho perustuu Kurimon mukaan ennen kaikkea siihen, että yrityksellä on ihmisten kännyköistä ja tietokoneilta kerätty valtava aineisto, jolla tekoälyä opetetaan.
– Puheentunnistuksessa on tärkeää tunnistaa kaikenlaisia ihmisiä, jotka puhuvat hyvinkin eri tavalla. Tämä saavutetaan vain keräämällä aineistoa mahdollisimman monilta ihmisiltä, hän sanoo.
Suomen kieli tutkijoiden valttikortti
Suomessa puheentunnistusta on tutkittu nelisenkymmentä vuotta. Suomalaiset tutkijat ovat hyötyneet suomen kielen ominaispiirteistä. Suomessa on paljon morfologiaa eli muuntelua sanojen taipumisen ja ylipäänsä kielen rikkauden takia. Siksi suomalaistutkijoiden kehittämistä menetelmistä on ollut apua muiden runsaasti muuntelua sisältävien kielten, erityisesti arabian, koneellista tunnistusta kehitettäessä.
Suomalaistutkijoiden tuloksista ovat hyötyneet myös suuret ulkomaiset teknologiayritykset.
– Tiedän, että julkaisumme luetaan tarkkaan ja uusimmat asiat vaikkapa melua kestävästä puheentunnistuksesta ja kielimalleista otetaan käyttöön hyvin nopeasti yritysten tuotteissa. Meiltä on myös lähtenyt tohtoteita töihin esimerkiksi Googlelle ja Amazonille, sanoo professori Mikko Kurimo Aalto-yliopistosta.
Hyötyykö yliopisto tästä?
– Ihmisten työllistyminen ulkomaille on hyvää mainosta. Usein he palaavat Suomeen jossain vaiheessa ja käyttävät saamaansa oppia täällä. Enemmän tästä on hyötyä kuin haittaa.
Aalto-yliopistossa on hiljattain kehitetty saamen kielen tunnistusta. Lisäksi tutkijat selvittävät, miten koneen saisi ymmärtämään maahanmuuttajien puhumaa epätäydellistä Suomea ja lasten puhetta.
Entä miten on Savon murteen laita?
– Se ei tietenkään toimi suomen puheentunnistuksessa, ja siihen on monta syytä. Ääntäminen poikkeaa tavallisesta suomen kielestä ja murteessa käytetään erilaista sanastoa, eli kielimallikin pitää opettaa uudelleen. Lisäksi Savossa puheen ymmärtäminen ei mene samalla kaavalla kuin normaalissa suomen kielessä, hän kuvaa tieteellistä haastetta.
Kurimo arvioi, että lähivuosina nähdään runsaasti puheentunnistukseen ja luonnollisen kielen ymmärtämiseen perustuvia sovelluksia, sillä Google on avannut kehitysympäristönsä vapaaseen käyttöön.
– Pieniltäkin yrityksiltä tulee varmasti paljon sovelluksia, esimerkiksi erilaisia tietopalveluita tai pelejä vaikkapa vieraan kielen opiskeluun.
Samaa korostaa myös Googlen Corrado. Hän arvioi, että ihmisen ja koneen vuorovaikutus paranee selvästi lähivuosina.
– Nykyään kommunikointi tietokoneen kanssa on robottimaista: asiat pitää sanoa juuri oikealla tavalla. Lähivuosina tietokoneet ymmärtävät käyttäjän aikomuksen, laajemman asiayhteyden ja jopa käyttäjän mielialan. Vuorovaikutuksesta tulee sujuvaa, hän lupaa.
“Maksaisin mieluummin rahalla kuin yksityisyydellä”
Näyttää siis siltä, että ihmisten arjesta, heidän liikkumisestaan ja puheestaan kerätyt tiedot ovat teknologiayritysten menestyksen avain. Yritysten huippututkijat analysoivat tekoälyn avulla maailman suurinta datamassaa.
Tietoturvayritys F-Securen tutkimusjohtaja Mikko Hyppönen näkee kehityksessä myös riskejä: sujuvaa käyttäjäkokemusta rakennetaan ihmisten yksityisyyden kustannuksella. Googlen kaltaiset yritykset pystyvät valtavien tietokantojensa ja tekoälyjärjestelmiensä avulla profiloimaan ihmisiä hyvinkin tarkasti.
– Annamme vapaaehtoisesti tietomme yhdysvaltalaiselle yritykselle, jonka ei tarvitse noudattaa Suomen lakeja tietojemme käsittelystä. Google tekee toki loistavia tuotteita. Toivoisin vain, että voisin maksaa niistä rahalla enkä yksityisyydelläni, hän sanoo.