1. yle.fi
  2. Uutiset
  3. suomen kieli

OMG ja LOL eivät ole enää mitään – nyt tietokoneiden pitäisi tajuta nuorten uusi muotisana

Tietokone ei ymmärrä puhettamme, kun se ei tajua suomen kielen monipuolista sanastoa.

suomen kieli
Talvinen maisema, jossa kännykän ruudussa näkyy sääennustejuttu
Lahjoita puhetta -kampanjan avulla yritetään saada tietokoneet ymmärtämään mitä erikoisimpia suomen kielen murteita ja erikoissanoja.Maxim Potkin, Unsplash / Annukka Palmén-Väisänen

Liikunnanohjaaja Mikko Repo istahtaa tietokoneen ääreen.

Hän on juuri päättänyt lahjoittaa oman osuutensa puhetta valtakunnalliseen Lahjoita puhetta -kampanjaan. Siinä ajatus on, että mahdollisimman moni suomalainen puhuisi juuri sitä suomea, mitä itse normaalistikin puhuu. Puhe nauhoitetaan ja annetaan tutkijoiden käyttöön.

Lahjoitettavan puheen ei pidä eikä tarvitsekaan olla oikeakielisesti virheetöntä yleiskieltä.

Sellaista ei ollut Mikko Revonkaan puhe, kun Lahjoita puhetta -sivusto pyysi kertomaan lemmikkieläimen aamiaisesta.

Mikko Repo kertoo minuutissa, miten hänen vanhempiensa terrieri aloittaa aamunsa.

Jokaisen ihmisen, kuten edellä Mikko Revon, rennossa puheessa on taukoja, pieniä äännähdyksiä öö, mm tai ää, sanojen hakemisia tai väärin sanotun sanan korjaamista.

Toinen meistä puhuu hitaasti ja toinen nopeasti. Joku puhuu korkealta ja toinen matalalta. Puhujien r- tai s-äänteet voivat olla hyvinkin erilaisia riippuen esimerkiksi siitä, mistä puhuja on kotoisin.

Kuvakaappaus Lahjoita puhetta -sivulta: Valittavien aiheiden lista.
Tietokone tarjoaa malliksi erilaisia aiheita, joista voi puhua ihan mitä vaan.

Suomessa ja muuallakin maailmassa yhtenä tietoteknisenä tavoitteena on, että tietokoneet ymmärtäisivät puhetta. Esimerkiksi vanhukset pystyisivät puheellaan antamaan komentoja älypuhelimelleen tai sairaalassa potilas voisi pyytää älyrobottia ojentamaan lasillisen vettä.

Jotta tietokone voisi ymmärtää puhetta, sille pitää kertoa, miltä suomen kieli kuulostaa. Tietokoneen pitää tietää, millaisia ovat lukuisat suomen kielen eri tavat sanoa vaikkapa "minä", "mennä" tai "Haluaisin puhua lääkärin kanssa".

Ohjeet vuohelle

Tietokoneen ääressä Lahjoita puhetta -sivusto pyytää Mikko Repoa seuraavaksi kertomaan kuvassa näkyvästä vuohesta, joka on sotkeutunut naruihin.

"Eli kuvassaha on siis nyt tämmöne vuohi (taukoa) mikä on tohosen (taukoa) köyteen sotkeutunu aika pahasti eli se on jalkoja pitkin ihan solmussa sielä (taukoa) nii nyt pitäis täst kuvast lähtee neuvomaa et miten se pääsis sieltä (taukoa) sieltä, sieltä ensin auki ja suoraks et se pääsis ees yhtää tonne liikkumaa. "

Tältä kuulosti, kun Mikko Repo alkoi antaa vuohelle ohjeita.

Monenlaista puhetta

Lappeenrannan Kimpisen yläkoulun äidinkielen ja kirjallisuuden opettajalla Heidi Seleniuksella on hyvä näppituntuma yläkouluikäisten puhetapaan. Vaikka Etelä-Karjalassakin on tietty murre, on nuorten puhe hänen mukaansa selvästi yleiskielistymässä, eikä koululaisten puhe olen enää niin murteellista kuin joskus aiemmin.

Mie- ja sie-sanoja kuulee koko ajan vähemmän. Niiden rinnalle ovat tulleet ja , kertoo Selenius.

Selenius on hiljattain kysynyt 7.-luokkalaisilta, käyttävätkö he persoonapronomineina mie- vai -sanaa.

– Kaikki sanoivat käyttävänsä mie, mutta yli puolet sanoivat käyttävänsä myös sanaa .

Mikko Repo ja Heidi Selenius istuvat pöydän ääressä.
Mikko Repo (vas.) ja Heidi Selenius innostuivat puheen lahjoittamisesta. Ville Toijonen/Yle

Lasten ja nuorten kielestä aikuisten korviin sattuvat helposti englanninkieliset ilmaukset. Juuri nyt muotisana on legit.

– Itse jouduin vähän aikaa pohtimaan, mikä on legit. Piti oikein miettiä, että mistä tässä on kysymys ja milloin tätä käytetään.

Legit voi tarkoittaa "ihan oikeastiko olet tuota mieltä" tai "oikeasti" tai sitten tehostesanaa, jonka merkitys selviää vain asiayhteydestä.

Muodista ovat hiljalleen poistuneet muutaman vuoden takaiset hittisanat LOL (laughing out loud tai harvemmin lots of laugh) tai OMG (Oh my God). Ne olivat opettaja Heidi Seleniuksen mukaan omiaan typistämään muuten rikasta puhekieltä.

– Yritän aina rohkaista monipuoliseen sanan käyttöön. Sen sijaan että sanoo lol, voisi sanoa esimerkiksi "nauroin ihan vedet silmissä".

Lol-sanasta ei myöskään aina ollut varma, onko sanoja ihan tosissaan vai tarkoittaako kuitenkin, ettei naurata yhtään.

Mä pyrkii rinnalle

Helsingin yliopiston suomen kielen dosentti, filosofian tohtori Hanna Lappalainen on perehtynyt suomen puhekieleen ja puhetapaan erilaisissa kielenkäyttötilanteissa.

Hän on havainnut, että ihmiset kyllä arvostavat omaa ja oman kotiseudun murretta ja pitävät sen säilymistä tärkeänä. Se ei kuitenkaan aina realisoidu käytännössä, kun ihmiset tietoisesti tai tiedostamattaan luopuvat murteestaan.

– Eteläpohjalaisilla ja eteläkarjalaisilla on tutkimuksien mukaan vahva murreitsetunto. He pitävät murrettaan kauniina ja uskovat, että muut arvostavat sitä. Savolaiset ja pohjoiskarjalaiset arvostavat itse omaa murrettaan, mutta saattavat ajatella, etteivät muut siitä tykkää, havainnollistaa Lappalainen.

Lappalainen on havainnut saman kuin Kimpisen koulun äidinkielen ja kirjallisuuden opettaja Heidi Selenius. Nuoret käyttävät oman kotimurteensa mie-sanan rinnalla mä-sanaa. Hän ei kuitenkaan vielä ole huolestunut murteiden katoamisesta.

– Vasta aika näyttää, yleistyykö mä-sana koko Suomessa yleisimmin käytetyksi persoonapronominiksi.

Graafinen kuva: Ihmishahmo sanoo mää / mie / minä. Vieressä Suomen kartalla näkyy erilaisia puhetapoja kuvaavia puhekuplia.
Suomen murteissa on useita tapoja sanoa minä. Tietokoneen pitäisi oppia ymmärtämään ne kaikki. Minna Lusa

Missä innokkaat eteläpohjalaiset?

Lahjoita puhetta -kampanjaan (siirryt toiseen palveluun) on tällä hetkellä saatu puhetta yli 3 000 tuntia. Tavoite olisi saada 10 000 tuntia tai ainakin 5 000 tuntia.

Innokkaimpia lahjoittajia ovat tähän mennessä olleet Kainuun, Etelä-Karjalan ja Pohjois-Karjalan asukkaat. Lähelle heitä pääsevät myös puheen lahjoittajat Lapista, Pohjois-Savosta, Hämeestä ja Keski-Pohjanmaalta.

Niiden jälkeen tulevat järjestyksessä Pohjois-Pohjanmaa, Satakunta, Keski-Suomi, Etelä-Savo, Kymenlaakso, Etelä-Pohjanmaa, Päijät-Häme, Varsinais-Suomi, Pirkanmaa ja Uusimaa.

– Mukava kuulla, että itäsuomalaiset ovat innokkaasti lahjoittaneet puhetta. Varmasti tässä vaikuttaa myös se, miten hyvin kampanja on eri puolilla Suomea ollut esillä ja otettu vastaan. Tutkimustiedon valossa yllättävää on, että Etelä-Pohjanmaalta ei ole voimakkaasti lähdetty mukaan, vaikka siellä on paljon vahvaa halua säilyttää murre, kertoo suomen kielen dosentti Hanna Lappalainen.

Tietokone kodin ikkunan äärellä, ikkunasta näkyy punainen omakotitalo.
Puhetta voi lahjoittaa tietokoneen tai puhelimen välityksellä. Antti Seppälä, Yle

Erityisesti Pohjanmaalta ja Ahvenanmaalta on ollut todella vähän puheen lahjoittajia.

– Olisi tärkeää saada kaikkialta Suomesta puhetta mukaan, sanoo Lappalainen.

Murre ei ole vain murresanoja tai sanojen käyttöön liittyviä piirteitä. Esimerkiksi vokaalien pituudet vaihtelevat eri puolilla Suomea. R-äänne on Etelä-Pohjanmaalla selvästi erikuuloinen kuin Pohjois-Karjalassa. Tampereen seudulla puolestaan l-äänne kuulostaa hyvin erilaiselta kuin vaikkapa Kuopiossa.

– Viimeiseen saakka puheessa säilyy prosodia eli sanojen rytmi, painotus ja intonaatio. Nämä ominaispiirteet usein säilyvät, vaikka muuten yrittäisi häivyttää murrettaan, sanoo Lappalainen.

Kone on kova oppimaan

Vaikka suomen kieli on eri puolilla Suomea erilaista, tulkitsevat aivomme puheen suomen kieleksi ja ymmärrämme sitä.

Sen sijaan tietokoneelle voi tulla hankaluuksia, jos se ei ymmärrä, että mennee, mänöö ja männöö merkitsevät kaikki samaa sanaa menee.

Siksi suomalaisilta kerätään nyt erilaisia puhetyylejä ja tapoja. Jokainen meistä puhuu vähän eri tavalla, ja olisi tulevaisuutta varten tärkeää saada tietokoneet ja älypuhelimet ymmärtämään meidän puhettamme.

Vaikka sanojen kirjo on niin valtava, uskoo dosentti Hanna Lappalainen tietokoneiden oppivan ymmärtämään myös puhuttua suomea.

– Siihen tarvitaan iso massa puhetta. Tietotekniikka on mennyt niin nopeasti eteen päin, että varmasti se onnistuu.

Ongelmia luulisi olevan tietokoneellakin viimeistään siinä vaiheessa, kun ihminen käyttää oman alansa erikoistermejä, slangisanoja tai harrastusporukan käyttämiä harvinaisuuksia. Hanna Lappalainen ei pidä mahdottomana, että jonain päivänä tietokone tajuaa nekin.

– Suomen kielessä on aika paljon haastetta tietokoneille, koska kielessä hyvin runsas äänne- ja muoto-oppi. On paljon sanojen taivutusta ja sanoissa erilaista vaihtelua. Automaattinen puheen analyysi kuitenkin kehittyy kovaa vauhtia.

Oppilaat mukaan

Liikunnanohjaaja Mikko Repo on kotoisin Parikkalasta, joka sijaitsee noin 100 kilometrin päässä Lappeenrannasta. Jo sellainen välimatka tuntuu kuulijan korvissa.

– Jo ensimmäisellä tunnilla Lappeenrannassa joku kysyi, että mistä päin sinä olet. Asiakkaat huomasivat puheessa heti pieniä eroja, kertoo Repo.

Lahjoita puhetta -sivustolle voi mennä lahjoittajaksi, vaikka ei olisi niin sanotusti kova puhumaan. Sivusto ehdottaa erilaisia aihealueita, eikä vääränlaisia tarinoita ole.

Lahjoita puhetta -kampanjan järjestävät Helsingin ja Turun yliopistot, Aalto Yliopisto, Yle sekä Valtion kehitysyhtiö Vake.

Nuori nainen pitelee puhelinta, jolla näkyy Lahjoita puhetta -keräyksen yksi tehtävä. Kuvassa myös hankkeen nimi ja logo.
Tähän mennessä suomalaiset ovat lahjoittaneet 3 000 tuntia puhetta. Lisää tarvitaan, jotta kaikki erilaiset puhetavat saataisiin talteen. Taustakuva: 7shifts / Unsplash. Grafiikka: Annukka Palmén-Väisänen / Yle

Lahjoitettua puhetta käytetään tekoälyn tutkimukseen ja kehitykseen sekä kielentutkimukseen. Aineisto päätyy Helsingin yliopiston hallintaan ja sitä voidaan Kielipankin kautta välittää edelleen suomalaisille ja kansainvälisille yrityksille sekä tutkijoille.

Lahjoittaja ei anna itsestään mitään muita henkilötietoja kuin asuinmaakunnan. Siitä huolimatta suuria salaisuuksia sinne ei luonnollisestikaan kannata kertoa.

Mikko Repo on lahjoituksensa suorittanut. Kasvoilta paistaa tyytyväisyys.

– Ihan mukavaa rupatteluahan tämä on. Kun eteläkarjalaisia ollaan, niin juttua tuppaa tulemaan, naurahtaa Repo.

Lappeenrannan Kimpisen yläkoulun äidinkielen ja kirjallisuuden opettaja Heidi Seleniuskin innostuu.

– Tätä voisi kokeilla oppilaidenkin kanssa. Olisi hienoa kuulla, millaisia tarinoita oppilaat keksivät. Täytyy ehdottomasti kokeilla.

Puhetta voit lahjoittaa tietokoneen selaimen kautta tai sovelluskaupasta ladattavalla mobiilisovelluksella. Ohjeet ovat tässä. (siirryt toiseen palveluun)

Lue seuraavaksi: Joukko suomalaisia kantaa puheessaan ikivanhaa jäännettä, jolle ei löydy edes aakkosista kirjainta: "Joudun toistamaan itseäni"

Lue seuraavaksi