Koe uusi yle.fi

Lautapelissä supertähden voittaneen tekoälyn kehittäjä: Ensin kone oppi ihmiseltä, nyt ihminen koneelta

Viime keväänä AlphaGo-tekoäly voitti ihmisen go-lautapelissä. Koneen toisessa pelissä tekemä siirto numero 37 näytti ensin järjettömältä, mutta osoittautui myöhemmin nerokkaaksi ja jopa luovaksi. Yle kysyi pelin kehittäjältä, miltä hänestä tuntui historiallisella hetkellä.

tiede
Etelä-Korean Lee Se-dol pelaa shakkia tekoälyä vastaan.
EPA

Kymmenet miljoonat ihmiset seurasivat suorassa lähetyksessä, kun go-lautapelin supertähti Lee Sedol kamppaili elämänsä vaikeinta kilpakumppania vastaan. Haastajana oli AlphaGo-tekoäly.

Sen kehittäjät teknologiajätti Googlella olivat opettaneet tekoälyä kymmenien miljoonien aiempien go-otteluiden perusteella – sekä koneen peleillä sitä itseään vastaan. Vahvistusoppimisessa tekoälyä palkitaan onnistumisista. Näin tekoäly alkaa kehittää pelitapaa, joka todennäköisimmin johtaa haluttuun lopputulokseen – voittoon.

Jo ensimmäisessä pelissä Lee joutui taipumaan. Toisessa pelissä pelaajat olivat ehtineet latoa laudalle 36 kiveä, kun tapahtui jotakin yllättävää. AlphaGo asetti mustan kivensä poikkeukselliseen paikkaan viitosriville. Peliä suorassa lähetyksessä selostaneet asiantuntijat arvioivat, että kone on tehnyt virheen.

Myös peliä seurannut AlphaGo-tekoälyn kehittäjä Thore Graepel oli hämmentynyt.

– Olin hieman shokissa: meniköhän tuo aivan oikein? Myöhemmin olen pitänyt siitä, että AlphaGo on on tuonut esiin pelitapoja, jotka haastavat maailman parhaat pelaajat.

Siirto hämmensi myös Lee Sedolin, joka päätti pitää sääntöjen salliman tauon ja sulatella outoa siirtoa, joka myöhemmin osoittautui nerokkaaksi. Hän palasi laudan ääreen – ja 174 siirtoa myöhemmin hän oli hävinnyt.

Viidestä AlphaGo-tekoälyä vastaan pelaamastaan pelistä hän onnistui lopulta voittamaan vain yhden. Kone oli osoittanut ylivertaisuutensa ja Googlen tiimi nappasi pelin voitosta luvatun miljoonan dollarin palkinnon.

– AlphaGo yhdistää intuitiota arvioihin siitä, mitä tietyistä siirroista seuraa. Tämän ansiosta se pystyy analysoimaan hyvin syvällisesti, mitä pelissä tulee myöhemmin tapahtumaan, selittää Graepel koneen menestystä.

Google DeepMindin tutkija Thore Graepel .
Google DeepMindin tutkija Thore Graepel kehitti tiimeineen Alphago-tekoälyn, joka voitti ihmisen go-lautapelissä maaliskuussa. Hän arvioi, että samankaltaista tekoälyä voidaan käyttää myös lääketieteellisten diagnoosien tekemisessä. Tanskan yleisradio haastatteli Graepelia Sveitsin Zürichissä kesäkuussa.Tuomas Kerkkänen / Yle

Graepel kertoo myös, että tietyt huippupelaajat ovat alkaneet soveltaa AlphaGon oppimia siirtoja omissa peleissään.

– AlphaGon menestys perustui siihen, että se oppi ihmisten pelaamista peleistä. Nyt ihmiset oppivat AlphaGolta. Tätä voi kutsua koneen ja ihmisen yhteisevoluutioksi, hän pohtii.

Graepel arvioi, että hänen tiiminsä kehittämää tekoälyä tullaan käyttämään muihinkin sovelluksiin kuin peleihin. Esimerkiksi hän poimii lääketieteellisten diagnoosien tekemisen.

– AlphaGota opetettiin aiempien pelien perusteella. Samaan tapaan voidaan opettaa tekoälyyn perustuvaa lääketieteellistä diagnoosijärjestelmää. Tietokoneelle esitetään suuri määrä potilastietoja ja lääkärien niiden perusteella tekemiä ratkaisuja, hän kuvaa.

Entä voisiko sitä käyttää esimerkiksi sijoituspäätöksiin?

– Tämä on mahdollista. Tiedän, että esimerkiksi hedge-rahastot käyttävät tekoälyjärjestelmiä sijoitustoiminnassaan, hän sanoo.