Solvaako Google-kääntäjä nimeäsi? Konekääntämistä tutkinut: "Tämä on uuden neuroverkon juttu"

Googlen käännösohjelmalla suomesta englanniksi väännetty muunnos on saanut suomalaiset testaamaan omaa nimeään.

Konekääntäminen
Google käännös matti mäkinen
Yle

Minä olen matti mäkinen kääntyy Googlen käännösohjelmalla muotoon I'm crazy hilly. Käännösohjelma ei tunnista pienellä kirjoitettuja etu- ja sukunimiä nimiksi, vaan etsii niille vastinetta englannin kielestä. Facebook on täyttynyt iloisista nimenmuuntelijoista viime aikoina.

Googlen käännösohjelma (siirryt toiseen palveluun) (translate.google.com) on viime syksystä alkaen käyttänyt hyväkseen neuroverkkoja, jotka tutkivat tekstiä hieman eri tavalla kuin aiempi tilastollinen kääntäminen. Käytännössä ohjelma yrittää tulkita tekstiä laajemmin kuin pelkkinä merkkijonoina.

Jos tämä ei onnistu, niin käännösohjelma pilkkoo pienellä kirjoitetusta nimestä osia ja kääntää ne. Näin kävi esimerkiksi konekääntämistä tutkivalle Turun yliopiston yliopistonlehtori Maarit Koposelle.

Hän naurahtaa, että lopputuloksena koelauseesta oli I am the land of the skull.

– Tämä on selvästi Googlen uuden neuroverkon juttu. Neuroverkot laskevat sanalle vektoreita eli minkälaisessa ympäristössä sana esiintyy. Sen perusteella ne etsivät käännöskielestä vastaavassa ympäristössä olevan sanan, selvittää Maarit Koponen.

– Mutta kun nimiä ei juurikaan esiinny, niin käännösohjelma ryhtyy hakemaan samankaltaisuutta merkkipohjaisesti. Esimerkiksi juuri nimessäni oleva maa-osuus lähtee hakemaan land, vaikka sillä ei sinänsä ole mitään tekemistä varsinaisen maan kanssa, sanoo Maarit Koponen.

google kääntäjä Maarit Koponen
Yle

Konekäännös ei edelleenkään ymmärrä kielen kaikkia ominaisuuksia

Aikaisemmin tilastollinen käännin käsitteli sanat vasemmalta oikealle paria sanaa kerrallaan, niin uusi neuroverkko käsittelee laajemmin koko lausetta ja saattaa muuttaa lauseen alun käännöstä lopun perusteella.

Yliopistonlehtori Maarit Koponen ei usko, että kyseessä olisi Googlen markkinointijippo, jolla hamutaan uusia käyttäjiä hauskan kokeilun avulla.

Kaikilla nimi ei käänny ollenkaan. Koneilla on tietty opetusaineisto, jossa voi esiintyä joku nimi. Esimerkiksi aineistossa saattaa olla Markku tai Sandell, sillä lopputulos nämä nimet pienellä kirjoitettuna testilauseeseen laitettuna ei muuttanut mitään.

Kyseessä sinänsä ei ole uusi ilmiö, sillä nimiä on saattanut kääntää hassusti jo aiemminkin.

– Edellisissä eduskuntavaaleissa oli monta Paavo-nimistä ehdokasta. Google-kääntäjä käänsi kaikki Paavot Spongebobeiksi sen takia, että Spongebob Squarepants on Paavo Pesusieni -niminen suosittu animaatiohahmo, muistelee Maarit Koponen.

– Onhan näitä hassuja sattumia, joita tulee ja menee näiden konekääntien kanssa.

Turun yliopiston nettisivujen blogissaan Maarit Koponen pohtii konekääntämisen (siirryt toiseen palveluun) mahdollisuuksia.

Tuttu netti-ilmiö jo aiemmin

Ison kielialan yritys Lingsoftin projektipäällikkö Heli Ervastin mukaan kyseessä on jo vanha juttu, joka aina silloin tällöin pomppaa esiin.

– Kyse on itse asiassa jo vanhasta meemistä, joka ponnahtaa pinnalle aina välillä. Yleensä työkaluna on joku hakukone tai verkkokäännin, johon kirjoitetaan esim. "i am..." tai " is..." tai muu vastaava fraasi. Meemivariaatioita on luultavasti kymmenkunta ellei enemmänkin, ja jopa Wired-julkaisu hyödyntää tämän tyyppisiä hakukoneisiin syötettäviä fraaseja julkkishaastatteluissaan, kertoo Heli Ervasti Lingsoftilta.

Googlen konekäännin hyödyntää voimakkaasti Googlen omia käyttäjistä keräämiä hakutuloksia ja metatietoja sekä verkossa laajasti jaossa olevaa henkilön nimeen liittyvää tietoa. Lisäksi Google käyttää Heli Ervastin mukaan käännöskorpuksena kaikkia niitä verkkolähteitä, joihin heidän hakuboteillaan on pääsy.

Sen takia englanninnokset voivat tällaisissa meemeissä olla joko todella outoja tai sitten olla pelkästään ihmisen oma nimi.

– Tässä on ehkä eniten kyse neuroverkkokääntämisen ja hakuteknologian tulosten yhdistämisestä, arvelee Heli Ervasti.

– Tällaisten ilmiöiden rakentaminen ja viraaliuttaminen on yleensä enemmän sattuman kauppaa kuin huolellisen suunnittelun takana.