Aviomies halusi iltatytön, toimittaja munia kansanedustajalta – puhelimen mokaileva tekstinsyöttö voi myös oppia

Mies viestitti kiireissään vaimolleen: Voisitko viedä pojat harkkoihin ensi tiistaina? Ottaisin klo 18-19 lyhyen iltatytön. Kännykän ennakoiva tekstinsyöttö korjasi omin päin työn tytöksi... Kotona taisi riittää selitettävää.

Ennakoiva tekstinsyöttö
kuva viestiketjusta
Päivi Meritähti / Yle

Puhelimien ennakoiva tekstinsyöttö on kaikille älypuhelimien käyttäjille tuttu kieliteknologian sovellus, joka on tehty nopeuttamaan ja helpottamaan viestien kirjoittamista. Välttämättä se ei kuitenkaan aina toimi käyttäjän haluamalla tavalla.

Sovellus on jo muutamasta kirjaimesta tarjoamassa sanaa, jota luulee meidän tarkoittavan. Sovellukset vaihtavat mielestään virheellisen sanan toiseen tai/ja tarjoavat kirjoittajalle omia ehdotuksiaan.

Jaksa sinnitellä ennakoivan kanssa pari viikkoa. Siinä ajassa virheet alkavat vähentyä.

Laitekouluttaja Antti Tuurala, Samsung

Jos väärät sanat pännivät, sovelluksen voi ottaa pois käytöstä, tai jaksaa jatkaa viestien kirjoittamista, jolloin järjestelmä oppii tunnistamaan käyttäjän sanoja.

– Nyrkkisääntö on: Jaksa sinnitellä ennakoivan kanssa pari viikkoa. Siinä ajassa virheet alkavat vähentyä. Jos viestittää hyvin värikkäällä kielellä, murteilla ja omilla lyhenteillä, puhelinta joutuu opettamaan kauemmin, kertoo tuotekouluttaja Antti Tuurala Samsungilta.

Algoritmeja ja kielimallia

Ennakoivat tekstinsyöttösovellukset perustuvat kielimalleihin. Jotta malli voisi toimia, sovellus tarvitsee jotakin mistä ennustaa. Sen pitää siis tietää riittävästi sanoja, sekä millä todennäköisyydellä sanat ja lauseet seuraavat toisiaan.

– Yleensä sovellus toimii niin, että on joku treenikorpus eli joku olemassa oleva kokoelma sanoja. Kokoelman perusteella algoritmit oppivat todennäköisyyksiä, kertoo kieliteknologian tohtoriopiskelija Jenna Kanerva Turun yliopistosta.

Varmasti kerätään myös käyttäjien yhteistä kieltä, siis sanoja, joita Suomessa käyttäjät yleisesti käyttävät. Toisaalta sama sovellus myös halutaan personoida käyttäjälle.

Tohtoriopiskelija Jenna Kanerva, Turun yliopisto

Algoritmit ovat tietokoneprosesseja ja kaavoja, jotka oppivat päättelemään käyttäjän tarkoittamaa sanaa.

Suomen kielessä morfologia eli muoto-oppi tuo omat haasteensa.

– Sanasto on paljon laajempi kuin vaikkapa englannin kielessä, koska eri taivutusmuodoissa olevat sanat on oltava sanastossa mukana, Kanerva kertoo.

Yhteistä kieltä ja yksittäisen käyttäjän dataa

Naistoimittaja tarvitsi kiireesti kansanedustajalta kommenttia uutissähkettä varten. Hän laittoi viestin, missä pyysi soittamaan ja korosti tarvitsevansa vain paria minuuttia. Hämmentyneen oloinen mies soitti pian takaisin. Yleltä lähetetty parin munan pyyntö oli hieman outo…

Tohtoriopiskelija Jenna Kanervan mukaan ennakoivien tekstinsyöttösovellusten kielimallit oppivat uusia sanoja, jos ne ohjelmoidaan seuraamaan käyttäjän dataa.

– Varmasti kerätään myös käyttäjien yhteistä kieltä, siis sanoja, joita Suomessa käyttäjät yleisesti käyttävät. Toisaalta sama sovellus myös halutaan personoida käyttäjälle, sanoo Jenna Kanerva.

Minne kaikkialle henkilökohtainen datamme päätyy tallennettavaksi, mihin sitä on lupa käyttää ja tiedämmekö edes mihin annamme luvan käyttää sitä?

Jenna Kanerva

Tuotekouluttaja Antti Tuuralan mukaan puhelimissa on yleensä valmiina jo tuhansia sanoja, ja puhelimeen mahtuu mieletön määrä myös omaa sanakirjaa.

Syrjäyttääkö sanelu kirjoittamisen?

Perinteinen tekstiviesti avasi aikoinaan matkapuhelimen käytölle aivan uuden ulottuvuuden. Nyt moni kirjoittaa puhelimellaan paljon enemmän kuin soittaa.

Monissa älypuhelimissa on jo tarjolla puheentunnistus-sovellus, joka nopeuttaa entisestään viestittelyä. Käyttäjä sanelee viestinsä ja puhelin muuttaa sen välittömästi tekstiksi.

Täydessä bussissa on helpompi näpytellä hiljaa viestejä kuin papattaa ne ääneen puhelimelle.

Antti Tuurala

Tohtoriopiskelija Jenna Kanerva uskoo, että puhuttu viesti voi hyvinkin nopeana ja vaivattomana korvata kirjoitetun viestin. Laitekouluttaja Antti Tuurala on epäröivämmällä kannalla.

– Täydessä bussissa on helpompi näpytellä hiljaa viestejä kuin papattaa ne ääneen puhelimelle.

Molemmat ovat kuitenkin yhtä mieltä siitä, että nykyiset sovellukset ovat vasta askel johonkin vielä paljon nopeampaan, helpompaan, laajempaan ja monipuolisempaan kieliteknologian käyttöön.

Jenna Kanervan mukaan kieliteknologiassa on menossa nopean kasvun vaihe, eikä välttämättä edes pystytä käsittämään mihin vielä ylletään.

–Teknologian kehitys ei ole pelottavaa. Tulevaisuus mietityttää lähinnä yksityisyyden suojan ja turvallisuuden kannalta. Minne kaikkialle henkilökohtainen datamme päätyy tallennettavaksi, mihin sitä on lupa käyttää ja tiedämmekö edes mihin annamme luvan käyttää sitä, Kanerva pohtii.

Entä miten kävi esimerkkimme miehen, joka viestitteli vaimolleen iltatytöstä. Töistä kotiin menoa kenties helpotti, kun mies tajusi ennakoivan tekstinsyötön tehneen tepposensa. Seuraava viesti nimittäin kuului: Pärkkele, ei siis iltatytön vaan iltatyön! Eläköön ennakoiva tekstinsyöttö! Enkä edes pidä lyhyistä iltatytöistä!

Juttua on korjattu: Haastateltavan arvio puhelimeen mahtuvien merkkien/sanojen määrästä tiivistetty.