Katso miten robottikäsi ratkaisee Rubikin kuution – Amerikkalainen tekoäly-yritys tuo algoritmit reaalimaailmaan

Itse oppivien tekoälysovellusten tuominen reaalimaailmaan on ollut tähän asti haastavaa.

tekoäly
Robottikäsi oppi ratkaisemaan Rubikin kuution
Robottikäsi oppi ratkaisemaan Rubikin kuution

Tekoälytutkimuslaitos OpenAI (siirryt toiseen palveluun) on onnistunut rakentamaan robottikäden, joka kykenee omatoimisesti ratkaisemaan Rubikin kuution. Dactyl-nimisen robottikäden liikkeet eivät ole yhtä sulavia kuin ihmisen, mutta haparoinnista huolimatta se suoriutuu tehtävästä joka viides kerta pudottamatta kuutiota.

OpenAI:n robottikäsi ei ole ensimmäinen tekoälyä hyödyntävä kone, joka onnistuu ratkaisemaan Rubikin kuution. Se ei myöskään ole nopein tai tehokkain kuution ratkaisija. MIT:n tutkijat onnistuivat viime vuonna rakentamaan laitteen, joka ratkaisee Rubikin kuution 0,38 sekunnissa (siirryt toiseen palveluun).

Alle 0,4 sekunnissa Rubikin kuution ratkaiseva robotti ei kuitenkaan ole käyttökelpoinen missään muussa tehtävässä. OpenAI:n Dactyl sen sijaan kykenee ihmiskäden lailla oppimaan uusia tehtäviä.

OpenAI:n tutkijat eivät ohjelmoineet yksittäisiä kädenliikkeitä 24-niveliselle robottikädelle, vaan tekoälyn taustalla sykkivä neuroverkko loi liikkeet itse. Rubikin kuution ratkaisuun tarvittavia siirtoja tekoälyn ei tarvinnut opetella. Niitä varten on kehitetty jo useita algoritmeja.

Vaikea hyppy virtuaaliympäristöstä reaalimaailmaan

Tekoälysovellusten ällistyttävistä suorituksista on viime aikoina kuultu paljon. Itseoppineet tekoälyt ovat voittaneet ihmisen niin shakissa (siirryt toiseen palveluun), Gossa (siirryt toiseen palveluun) kuin tietokonepeli Dota 2:ssa (siirryt toiseen palveluun).

Kaikki nämä sovellukset operoivat virtuaalimaailmoissa. Tekoäly ei siirtele nappuloita fyysisellä shakkilaudalla tai painele näppäimistöä Dota 2 -turnauksessa.

Tekoälysovellusten kehittäminen virtuaaliympäristössä on helpompaa ja nopeampaa kuin reaalimaailmassa. Esimerkiksi tietokonepelin opettamisprosessi voidaan milloin vain nopeuttaa vastaamaan tuhansien vuosien harjoittelua. Fyysisen laitteen opettamisessa samanlainen pikakelaus ei ole mahdollista.

Dactylin kouluttamisessa tutkijat onnistuivat hyödyntämään simuloituja ympäristöjä fyysisen käden kouluttamisessa. Ensin tekoäly harjoitteli Rubikin kuution käsittelyä ja ratkaisemista erilaisissa simuloiduissa ympäristöissä. Muutamassa kuukaudessa harjoittelua kertyi tuhansien vuosien edestä.

Tekoälyn koulutusta virtuaaliympäristössä.
Tutkijat loivat tuhansia simulaatioita, joissa tekoäly opetteli ratkaisemaan Rubikin kuution. Joka kerta, kun algoritmi oppi suoriutumaan tehtävästä hyvin, tutkijat vaikeuttivat tehtävää.OpenAI

Kun neuroverkon rakentama malli oli kerännyt tarpeeksi kokemusta simulaatioissa, se siirrettiin ohjaamaan fyysistä kättä. Vaikka tekoäly kykeni virtuaaliympäristössä ratkaisemaan Rubikin kuution, sillä kesti vuosi ennen kuin se sai robottikäden edes pyörittelemään kuutiota.

Vaikeudet johtuivat reaalimaailman ominaisuuksista. Kitkan, joustavuuden ja dynamiikan kaltaisten ominaisuuksien mallintaminen virtuaaliympäristöissä on vaikeaa, jolloin tekoäly ei heti kykene ottamaan fyysistä maailmaa haltuunsa.

Nyt reilut kaksi vuotta koko projektin alkamisesta, tekoäly onnistuu tehtävässä myös fyysisessä maailmassa.

Itseoppineet robotit sopeutuvat yllättäviin tilanteisiin

OpenAI:n tutkijat eivät ohjelmoineet robottikättä ratkaisemaan juuri Rubikin kuutiota. Ennemminkin he opettivat sen oppimaan kappaleen käsittelyä erilaisissa ympäristöissä.

Perinteisesti robotit ohjelmoidaan tarkasti suorittamaan tiettyjä tehtävä tietyllä tavalla. Tämän vuoksi ne eivät kykene sopeutumaan odottamattomiin tilanteisiin tai suorittamaan uudenlaisia tehtäviä.

Esimerkiksi paljon huomiota saaneet Boston Dynamicsin robotit (siirryt toiseen palveluun) on ohjelmoitu todella pitkälle, eivätkä ne pysty oppimaan itsekseen uusia liikkeitä, vaikka ympäristö sitä vaatisi.

Dactyl-robottikäsi sen sijaan kykenee sopeutumaan uusiin tilanteisiin. Tutkijat muun muassa teippasivat kaksi sen sormista yhteen ja häiritsivät sitä tökkimällä kynällä. Nämä eivät sotkeneet tekoälyn suoritusta, vaan se sopeutui häiriöihin.

Rubikin kuutiota ratkaisevaa robottikättä häirittiin kirahvilelulla.
Robottikättä häirittiin muun muassa kirahvilelulla.OpenAI

– Tämä on juuri oikea tapa kouluttaa algoritmia, eli mietitään yllättäviä tapahtumia ja toteutetaan niitä, sanoo Helsingin yliopiston tietojenkäsittelytieteen apulaisprofessori Teemu Roos.

Roos huomauttaa, että itseoppivia neuroverkkoja on hyödynnetty aikaisemminkin robotiikassa. OpenAI:n robottikäsi ei ole valtava harppaus kehityksessä, mutta se on taas yksi askel oikeaan suuntaan.

– Tässäkin on kyseessä tiukasti rajattu ongelma, eli Rubikin kuutio, Roos huomauttaa.

Rubikin kuution ratkaisu antaa kuitenkin lupauksen siitä, että tulevaisuudessa itseoppivat robotit voivat todella ohjata autojamme ja työskennellä rinnallamme. Vielä Dactylin kaltaisia itseoppineita robotteja ei ole uskallettu päästää häärimään tehtaisiin tai liikenteeseen, koska tosimaailmassa on yhä liikaa yllätyksiä tekoälylle.