Älykaiuttimilla on joskus myös ihmiskorvat – laitteiden tallenteita kuunnellaan puheohjelmien kehittämiseksi

Esimerkiksi verkkokauppa Amazonilla on tuhansia työntekijöitä tarkastamassa puhekäskyjä noudattavan Alexa-ohjelman tallenteita, kirjoittaa uutissivusto Bloomberg.

Älykaiuttimet
Älykaiutin
Amazonin Echo-älykaiuttimen tekoäly ymmärtää puhetta ja neuvoo verkko-ostoksilla.AOP

Kun puhetta tunnistavat älykaiuttimet yleistyvät reipasta vauhtia, kasvavat myös tietoturvaan ja yksityisyyteen liittyvät huolet.

Kaikki mitä älylaitteelle sanoo, ei välttämättä jää vain käyttäjän ja tunteettoman tietoteknisen järjestelmän väliseksi.

Bloomberg-uutissivusto kertoi keskiviikkona (siirryt toiseen palveluun), että verkkokaupan jätillä Amazonilla on tuhansia työntekijöitä eri puolilla maailmaa kuuntelemassa Echo-älykaiuttimen keräämiä tallenteita Alexa-järjestelmän puheentunnistuksen kehittämiseksi.

Amazonilla on työntekijöitä ja aliurakoitsijoita näissä tehtävissä ainakin Bostonissa, Costa Ricassa, Intiassa ja Romaniassa.

Romanialaiset työntekijät kertoivat uutissivustolle, että he tekevät yhdeksäntuntisia päiviä ja voivat käydä läpi jopa tuhat audiotallennetta yhden vuoron aikana.

Myös älykaiuttimia ja puheentunnistusta kehittävillä suuryhtiöillä Applella ja Googlella on väkeä vastaavissa tehtävissä, kirjoittaa BBC (siirryt toiseen palveluun).

Viime vuonna kuluttajat ostivat maailmanlaajuisesti 78 miljoonaa älykaiutinta, arvioi tutkimusyhtiö Canalys (siirryt toiseen palveluun).

Puheentunnistusohjelmat laajenevat suomen kaltaisille pienemmille kielialueille viiveellä, joten Suomi ei ole älykaiutinmarkkinoiden eturintamassa.

Esimerkiksi Amazonin Alexa-ohjelma ei tue suomea. Applen Siri-ohjelma ja Googlen puhelinsovellus tunnistavat suomen kieltä omissa rajoissaan.

Puheentunnistus ei kehity ilman ihmiskorvaa

Tyypillisesti työntekijät kirjoittavat auki äänitiedostoja ja varustavat ne merkinnöillä.

Tarkoitus on havaita virheitä ja puutteita, jotta ohjelmaa voidaan kouluttaa tulkitsemaan puhekäskyjä paremmin. Puheentunnistusohjelma ei siis kehity vain omia aikojaan itsestään.

Kuluttaja ei välttämättä tiedosta asiaa.

– Meidät on ehdollistettu olettamaan, että nämä koneet harjoittavat vain jonkinlaista maagista koneoppimista. Mutta fakta on, että siihen sisältyy vielä ihmistyötä, älykaiuttimien yksityisyydensuojakysymyksiä tutkinut Michiganin yliopiston professori Florian Schaub sanoi Bloombergin haastattelussa.

Amazonin Alexan palveluehdoissa ei sanota aivan suoraan, että ihmiset voivat kuunnella tallenteita.

Yhtiö korostaa, että se käyttää vain äärimmäisen pienen osan tallenteista ihmistarkastajien käsittelyssä.

– Tämä informaatio auttaa meitä kouluttamaan puheentunnistusta ja luonnollisen kielen tulkintajärjestelmiämme, jotta Alexa ymmärtää paremmin pyyntönne ja voimme varmistaa, että palvelu toimii hyvin kaikille, Amazon kirjoitti Bloombergille lähettämässään sähköpostivastauksessa.

Yhtiöt vakuuttavat suojelevansa yksityisyyttä

Amazonin mukaan työntekijöillä ei ole suoraa pääsyä tietoihin, joiden avulla he voisivat tunnistaa henkilön tai tilin.

Bloombergin näkemän ruutukaappauksen mukaan Alexan tarkastajille lähetyissä tallenteissa ei ole käyttäjän koko nimeä ja osoitetta, mutta niihin sisältyy tilin numero, käyttäjän etunimi ja laitteen sarjanumero.

Apple ja Google kertovat, että ne tekevät tallenteet nimettömiksi eikä niitä voi yhdistää asiakkaiden tileihin.

Amazonin Alexan yksityisyysasetuksissa ei voi kieltäytyä äänen tallentamisesta ja ihmisten tekemän tarkastuksesta, mutta niissä voi kieltää tallenteiden käytön uusien ominaisuuksien kehittämiseen. Käyttäjä voi myös kuunnella ja tuhota aiempia äänitallenteita.

Myös Google sallii äänitallenteiden kuuntelemisen ja tuhoamisen My Activity -sivullaan (siirryt toiseen palveluun). Apple sen sijaan ei anna käyttäjän kuunnella Sirin tallenteita.

Yleensä ottaen älykaiuttimen ei pitäisi lähettää tallennetta yhtiöiden palvelimille, ellei käyttäjä ensin aktivoi sitä tietyllä komentosanalla. Joskus laite voi tulkita samankuuloisen sanan komennoksi.

Bloomberg: Häiritseviäkin tallenteita tulee

Jotkut Amazonin työntekijät kertoivat Bloombergille, että he jakoivat huvittavia äänitiedostoja muiden työntekijöiden kanssa sisäisillä keskustelupalstoilla.

Eräät kertoivat kuulleensa myös järkyttäviä äänitiedostoja.

Kaksi Bloombergin haastattelemaa työntekijää kertoi kuulleensa tallenteilla ääniä, jotka viittasivat seksuaaliseen ahdisteluun. Yhtiön Romanian pisteessä työntekijöille oli sanottu, että ei ole Amazonin asia sekaantua tällaisiin tapauksiin.

Tietotekniikan asiantuntija ja tietokirjailija Petteri Järvinen arvioi blogissaan viime helmikuussa (siirryt toiseen palveluun), että älykaiuttimista nousee seuraava yksityisyyskohu.

Hänen mielestään ei pitäisi kuitenkaan tulla yllätyksenä, että yhtiöt käyttävät tallenteita puheentunnistuksen kehittämiseen.

– Sekä Amazonin että Googlen sivuilta pystyy kuuntelemaan kaiken, mitä on itse laitteelle aikaisemmin sanonut. Se tallentuu sinne ihan äänenä. On luonnollista, että kehittäjät kuuntelevat niitä ja kehittävät puheentunnistusalgoritmiä sen perusteella, Järvinen sanoo.

– Ei sen kenellekään pitäisi yllätyksenä tulla ja kyllä se on varmasti mainittu käyttöehdoissakin.

Pörssikurssi pakottaa avoimuuteen

Amazon ja Google ovat Järvisen mielestä varsin avoimia. Googlella on esimerkiksi ollut palvelussaan omien puheiden kuuntelumahdollisuus jo useita vuosia.

Eri asia on, ovatko kuluttajat itse hereillä.

– Kun niitä asetuksia on aika paljon ja se vaatisi vähän aktiivisuutta, moneltahan se jää tekemättä. Kyllä siihen keinot on, ja mielestäni toiminta on siinä mielessä avointa. Jos asiasta on kiinnostunut, kyllä ne tiedot sieltä löytää, Petteri Järvinen sanoo.

Järvisen mukaan Amazonin ja Googlen kaltaisten jättien etujen mukaista ei olisi piilotella tai toimia epäeettisesti.

– Se on näille isoille pioneereille tietysti elämän ja kuoleman kysymys. Niiltähän romahtaisi pörssikurssi, jos ne jäisivät kiinni jostain vilungista, Järvinen sanoo viitaten Facebookin äskettäisiin vaikeuksiin.

Hän näkee vaarana pikemminkin sen, että esimerkiksi hakkerit keksivät tavan kytkeä älylaitteen mikrofonin päälle tai jokin haittaohjelma tekee sen. Alalle voi tulla myös pieniä toimijoita, joilla ei ole mitään menetettävää.

Pitkällä aikavälillä kiinnostava kysymys on, miten puheentunnistus vaikuttaa ihmisen ja koneen suhteeseen, Järvinen pohdiskelee.

Kun koneille puhutaan kuin ihmisille konsanaan, aletaanko koneita lopulta kohdella kuin ihmisiä tai ihmisiä kuin koneita?

Puheentunnistus hiipii joka laitteeseen

Oman haasteensa yksityisyydelle ja tietoturvalle luo etenkin se, että puheentunnistukseen perustuva teknologia leviää nyt vilkkaasti eikä kyse ole pelkästään älykaiuttimista.

– Sekä Amazon että Google levittävät puheentunnistusta hyvin aggressiivisesti kaikkiin laitteisiin, Järvinen sanoo.

– Esimerkiksi kun olin tammikuussa Amerikassa teknologiamessuilla, niin tätä samaa teknologiaa oli upotettu muun muassa mikroaaltouuniin, vessanpyttyyn, toimiston lamppuun, autoihin. Samat puhekomennot, puheella saatavat palvelut tulevat jatkossa jokaiseen laitteeseen.

Älykaiuttimen voi vielä sulkea, mutta kehitys kulkee suuntaan, jossa ihminen ei enää edes tiedä, mitä kaikkia mikrofoneja hänen ympärillään on.

Järvinen ei silti usko, että kuluttajat ryhtyisivät vastarintaan ja torjuisivat kuuntelevien älylaitteiden voittokulun.

– Se olisi kyllä ensimmäinen kerta, kun kuluttajat kieltäytyisivät – ainakaan tietosuojasyistä, Järvinen sanoo.

– Aina on muutamia luddiitteja, jotka ovat kieltäytyneet, mutta enemmistö aina kaikesta nurinasta ja valituksesta huolimatta ottaa nämä laitteet käyttöön, koska niistä saa selvästi hyötyjä.

Luddiitit oli teollista vallankumousta vastustaneiden käsityöläisten protestiliike 1800-luvun alun Britanniassa.

Suomen kieli vielä hidasteena

Äskettäisessä mielipidekyselyssä (siirryt toiseen palveluun) Yhdysvalloissa yli 70 prosenttia vastaajista oli huolissaan älykaiuttimien yksityisyydensuojasta.

Luku oli suunnilleen sama sekä laitteiden omistajilla että ihmisillä, joilla niitä ei ollut.

Itsekin älykaiuttimia käyttävä Petteri Järvinen ymmärtää hyvin näppärien laitteiden viehätyksen.

– Kun katsoo, miten nopeasti nämä ovat lyöneet läpi Amerikassa, veikkaan, että sama kehitys toistuu Suomessakin, kun suomen kieli alkaa luistaa näiltä laitteilta.

Tällä hetkellä suomen kieli siis vielä hidastaa puheentunnistuksen etenemistä.

– Suomen kieli tavallaan suojelee meitä tältä nopeimmalta kehitykseltä, koska suomen kielen puhuminen ja kuuntelu, tulkitseminen on aika vaikeaa sijapäätteiden takia.

Aiheesta muualla:

Bloomberg: Amazon Workers Are Listening to What You Tell Alexa (siirryt toiseen palveluun) 10.4.2019

Buzzfeed: A Team At Amazon Is Listening To Recordings Captured By Alexa (siirryt toiseen palveluun) 10.4.2019

BBC: Smart speaker recordings reviewed by humans (siirryt toiseen palveluun) 12.4.2019

Petteri Järvinen, Havaintoja digimaailmasta: Seuraava yksityisyyskohu nousee älykaiuttimista (siirryt toiseen palveluun) 20.2.2019

Aihepiiristä aiemmin:

Älykaiuttimet valloittavat maailmaa, mutta Suomessa ei puheohjauksella saa taksia, leffalippuja tai paljon muutakaan 6.11.2108

Analyysi: Älykaiutin on vain yksi korva lisää olohuoneessasi – olemmeko jo matkalla kohti Orwellin painajaista? 26.12.2017

Tekoäly on jo nyt uusi perheenjäsen – kodin virtuaalisydän paistaa kohta kinkut ja pyytää kaveria kaljalle 26.12.2017

Kännykkä tunnistaa puheesi pian yhä paremmin – Savon murre silti liian kova pala 24.7.2017