Hyppää sisältöön

Linda Liukkaan kolumni: Mitä tapahtuu lukutaidolle, kun tietokone ymmärtää tekstiä paremmin kuin puoli miljoonaa suomalaista?

Sanan liittäminen sanaan voi olla tietokoneen tehtävä kun tekoälyn luetunymmärtäminen ja tekstin tuotanto kehittyy. Mutta sanan liittäminen ideaan säilyy edelleen ihmisellä, kirjoittaa Linda Liukas.

Linda Liukas
Linda Liukas Kuva: Mikko Ahmajärvi / Yle
Yle

Kesän lopulla Facebookin tutkijat julkaisivat tekoälymalli RoBERTa (siirryt toiseen palveluun)n, joka harppasi luetun ymmärtämisessä pitkälle ohi kilpailevien teknologioiden. Yhtäkkiä kone selvisi sarjasta tämänkaltaisia kysymyksiä:

“. . . Monet ihmiset uskoivat optimistisesti, että alan sisäiset palkinnot paremmille työkaluille loisivat edellytyksiä hiljaisempien laitteiden kehittämiselle. Ehdotettiin jopa, että rakennustyömaiden melua voisi helpottaa..”

Kysymys: Mikä on kirjoittajan asenne alan sisäisiä palkintoja kohtaan?

  1. Epäileväinen B. Positiivinen C. Innokas D. Puolueeton

Ihmiselle tehtävä olisi ollut helppo, mutta tietokoneelle arkijärki, asiayhteyksien ymmärtäminen ja luonnollisen kielen kanssa toimiminen on tähän asti ollut hankalaa. RoBERTan lisäksi myös muiden isojen teknologiayhtiöiden tekstiä lukevat, tuottavat ja ymmärtävät tekoälymallit ovat kehittyneet harppauksin.

Viime vuodet tekoälyn kehitys on ollut kuvantunnistuksen juhlaa. Me kuluttajat olemme kokeilleet vuoroin nuorentaa ja vanhentaa kuviamme, kauhistelleet aidon näköisiä tekojulkkiksia (siirryt toiseen palveluun)ja totutelleet ajatukseen videosta, jota voi muokata yhtä helposti kuin kuvaa. Nyt tapahtuu kuitenkin tekstin puolella.

On kuin touhukas leikki-ikäinen tekoäly olisi siirtynyt yläasteelle ja aloittanut vakavammat äidinkielen opinnot. Teoriatunneilla harjoitellaan tunnistamaan tekstin sävyä, analysoimaan Amazonin sademetsiä, ja tulkitaan väittämiä hapen ominaisuuksista. (siirryt toiseen palveluun)

Kielenkäyttäjänä tekoäly taas tuntuu luokan priimukselta. Opittuaan perustaidot, se osaa nykyisin korjata kielioppia (siirryt toiseen palveluun) ja karaoken sävelkorkeutta (siirryt toiseen palveluun), tunnistaa yhden äänen yleisössä (siirryt toiseen palveluun), matkia Bill Gatesia (siirryt toiseen palveluun), lukea huulilta (siirryt toiseen palveluun) ja tunnistaa flirttailun tekstistä. (siirryt toiseen palveluun) Eikä teknologiaa käytetä pelkkään viattomaan puuhasteluun. Aikaisemmin tänä vuonna yhdysvaltalainen OpenAI järjestö rakensi tekstin tuottamiseen niin tehokkaan tekoälymallin, että se päätettiin julkaista vain rajattuna version (siirryt toiseen palveluun)a. Järjestö pelkäsi väärinkäytöksiä: valeuutisten massasuoltamista, roskapostien ja ystäviä imitoivien bottien määrän räjähdysmäistä kasvua.

Samaan aikaan Suomessa on jo nyt puoli miljoonaa aikuista (siirryt toiseen palveluun), joiden lukutaito ja luetun ymmärtäminen eivät riitä nyky-yhteiskunnassa toimimiseen. Silti toivon, että lukutaitoa ja teknologiaa ei laitettaisi vastakkain. Sanan liittäminen sanaan voi olla tietokoneen tehtävä, mutta sanan liittäminen ideaan säilyy edelleen ihmisellä. Yksinkertaisetkin sanat piilottavat joukon tunteita, kuvia, muistoja ja kokemuksia joista tietokoneella ei ole aavistustakaan.

Me ihmiset tiedämme kurkkupurkeista, paikallispolitiikasta, pienistä iloista, sellerinjuurista ja siitä, miltä maailma näyttää toisen ihmisen silmin. Sanavarasto syntyy sanoilla leikkimisestä, niiden hieromisesta sormenpäissä ja kielellä, ei tilastollisista työkaluista.

Luku- ja kirjoitustaito on tulevaisuudessa ihmisen ja tekoälyn tiimityötä.

Muutama vuosi sitten päätin itse kokeilla tekoälyä tekstintuottamisen työkaverina (siirryt toiseen palveluun). Keräsin tuhansia esimerkkejä Marimekon vaatteiden nimistä, ja syötin ne neuroverkolle eli tekoälymallille. Neuroverkolle syötettiin esimerkkejä, kuten Jokapoika, Tasaraita ja Unikko. Sen tehtävä oli etsiä säännönmukaisuuksia joita ihminen ei pysty näkemään ja luoda uusia Marimekko-nimiä.

Ensimmäiset tulokset olivat karmeita. Valos, Inislö, Lahilitanti, ikEkunit, runoili tietokone. Mutta pian ymmärsin, että minulta vei peruskoulun verran hallita suomen kieli, tietokone oli saanut työskennellä vain muutaman tunnin. Annoin koneen raksuttaa lisää.

Yön jälkeen herättyäni olo oli kuin jouluaattoaamuna. Ja tulokset - ne olivat itäsuomalaisen iloisia ja tomeria. Pyininpakka, Tanohalti, Ruitintullo, Pukukka kulki koneen keksimien nimien poljento. Esimerkkejä syntyi tuhansia ja sain näkökulmia, joita en muuten olisi tullut ajatelleeksi.

Luku- ja kirjoitustaito on tulevaisuudessa ihmisen ja tekoälyn tiimityötä. Yhdessä olemme enemmän.

Linda Liukas

Kirjoittaja on lastenkirjailija, kuvittaja ja keskinkertainen koodari, joka uskoo, että maailmasta tulee parempi paikka kun tietojenkäsittelyn ammattilaisten lisäksi tarinankertojat, tutkijat ja taivaanrannanmaalarit innostuvat teknologiasta.

Aiheesta voi keskustella 13.11. klo 16.00 asti.

Lue myös:

Linda Liukkaan kolumni: Ruutuaika on osa pidempää leikin jatkumoa

Linda Liukkaan kolumni: Digitaalinen aikakausi pakottaa meidät pohtimaan, mitä haluamme muistaa ja mitä unohtaa

Suosittelemme sinulle