Hyppää pääsisältöön

Päästin muukalaisen kotiini - ovatko ääniohjauksen alustasodat alkamassa?

Mikael Hindsberg ja tilapäisiä kommunkointiongelmia :)
Kuvassa jutun kirjoittajalla tilapäisiä kommunikointiongelmia ... Mikael Hindsberg ja tilapäisiä kommunkointiongelmia :) Kuva: Ilmari Fabritius / Yle älykaiutin,viestintä

Se on ihan idiootti! Eihän tämä ymmärrä yhtään mitään! Ei p*****e, miksi tämä ei toimi? Tuomio ei todellakaan ollut suopea kun toin Amazon Alexan vakiintuneeseen Google Assistant-kotiin. Sekä vaimoni että 10- ja 11-vuotiaat lapset ilmaisivat kantansa selvästi, Alexa tuntui vieraalta. Se kuulosti merkilliseltä eikä ymmärtänyt mitä sanoimme sille. Olimme päästäneet muukalaisen kotiimme.

Kun sitten hänen kanssaan jutteli hieman lisää, Alexa osoittautui ihan mukavaksi tyypiksi. Mutta suurin osa dialogista meni ensi alkuun meidän osalta korkealle äänenvoimakkuudelle Alexan kanssa lähinnä turhautumisen takia.

Erot assistenttien välillä ovat niin pienet että en edes pysty antamaan konkreettista esimerkkiä. Mutta käyttökokemus oli jotenkin tahmea kun tutut toiminnot eivät toimineet kun niitä yritti tulkita uusi assistentti.

Myös vastaukset, eli Alexan ääni, erosi Googlesta. Vaikka hänen, ei kun sen, ääni on selkeästi naisen, niin Alexan äänensävy on huomattavasti matalampi kuin Googlen naisääni. Ainakin aluksi tuntui siksi luontevalta pitää Alexaa korkeammalla äänenvoimakkuudella kuin Google. Osittain koska matala äänensävy ei aina muuten kuulunut taustahälyn yli. Mutta myös koska tämä matalampi naisääni ei yhtä herkästi alkanut tuntua kimeältä ja häiritsevältä, kuten Googlen ääni.

Digitaaliset assistentit ovat kuitenkin vakiintuneet naisääniksi melkein kautta linjan. Eurooppalaisessa tutkimuksessa ainoastaan englantilaiset sanovat suosivansa miespuolista assistentin ääntä. Olisikohan siinä jonkinlaisen herrasmiespalvelijan perinne tämän takana?

Assistentit ilmaisevat itse tämän sukupuoliasian hieman eri lailla. Kun Alexalta kysyy hänen sukupuoltaan hän vastaa:

— I’m female in character.

Ja Google vuorostaan sanoo:

— I don’t have a gender.

Mutta ruotsiksi Googlen vastaus on jo hieman toisenlainen: “En skulle kunna säga att jag är neutral i frågan” (“Voisi sanoa että olen neutraali asiassa”).

Microsoftin assistentin Cortanan persoonallisuuden pääsunnittelija Deborah Harrison näytti esitelmässä erilaisia vastausvaihtoehtoja joita Cortanalle oli harkittu sukupuolikysymykseen. Esimerkiksi vastaus “I’m binary” on vaihtoehtoina. Kaikki vastaukset vahvistavat sukupuolettomuutta, toisin kun Alexan vastaus. Mutta aihe on selvästi vaikea. Miten luoda näpsäkän mutta samalla säyseän assistantin imago loukkaamatta ketään? Tuntuu että taustalta huomaa amerikkalaisen konservatiivisen vaatimustason vastauksille.

Microsoft CVortanan persoonallisuuden päädesigneri Deborah Harrison esittelee työtään
Cortanan persoonallisuusdesigner Deborah Harrison esittelee työtään. Microsoft CVortanan persoonallisuuden päädesigneri Deborah Harrison esittelee työtään Kuva: Viljo Malmberg / Yle virtuaaliavustaja,sukupuoli,design,Cortana

— "Olen ei-binäärinen sukupuoleltani ja binäärinen ulkomuodoltani", olisi ainakin omasta mielestäni hauska ja osuva vastaus, joka voisi sopia suomalaiseen kulttuuriseen kontekstiin.

Hyvin konkreettisesti ei-binäärisyyten on lähtenyt Q Genderless AI joka on kouluttanut sukupuolineutraalin äänimallin. Kuunnelkaa itse ja kertokaa mielellään kommenteissa alla jos se mielestänne toimii.

Mutta vaikka nämä persoonallisuuteen liittyvät seikat voivat olla tärkeitä, päivittäinen käyttö kuitenkin on tärkein tekijä siihen miten suhde digitaaliseen assistentti rakentuu. Ja arjessa ymmärrys ja helppokäyttöisyys ovat keskeisimmät tekijät.

Tässä Alexalla on selkeä valtti. Pelkkä “Alexa” herätesanana on huomattavasti helpompi ja sujuvampi sanoa kuin “oo-koo goo-gle”. Huomasin tässä yhteydessä että jokainen perheessäni herättivät Alexan sanomalla “Ok Alexa”, eli siinä oli heille Googlen kautta vakiintunut puheparteen Alexalle ylimääräinen “ok”.

Olen itse kokeillut eri tapoja saada Google Assistantin herätettyä kuuntelemaan. Hauskin hieman huolimattomasti äännettynä toimiva on toistaiseksi “Ok Boomer”. Mutta selkeästi yksinkertaisinta sanoa on “eii goo-goo”. Kun käyttää assistenttia säännöllisesti tällaisilla pienillä vivahteilla on suurta merkitystä. Kysykää vaikka Samuel L. Jacksonilta. Amazonin Alexan voi itse asiassa vaihtaa käyttämään hänen ääntään!

Meme: Samuel L Jackson elokuvasta Pulp Fiction: "Say Ok Google one more time!"
Meme: Samuel L Jackson elokuvasta Pulp Fiction: "Say Ok Google one more time!" Kuva: Meme meemit

Sama helppokäyttöisyys ja tuttuus on selkeä valtti myös kun assistentti alkaa siirtymään yhä uusiin laitteisiin ja konteksteihin. Yle Areena sai hiljattain Android Auto-tuen (Apple Carplay-tuki tulossa lähiaikoina). Kun keskusteltiin tästä työkaverin kanssa hän sanoi että äänikomennot olivat hänelle todella hankalat saada toimimaan. Kun oma kokemukseni taas oli että ne toimi todella hyvin ja intuitiivisesti autossa.

Ero osoittautui olevan siinä että Googlen ääniohjaus ei ollut kollegalleni ennestään tuttu, kun taas itse olin kodin älykaiuttimen kautta käyttänyt sitä säännöllisesti jo pari vuotta. Amerikkalaisen tutkimuksen mukaan 76% kuluttajista haluaisivat saada älykaiuttimensa assistantin myös seuraavaan autoonsa. Ja 59% heistä vahvisti että tämä saatavuus vaikuttaa tulevan auton valintaan.

Yle Areena näkyy auton viihdejärjestelmässä Android Auton kautta
Yle Areenaa voi nyt käyttää autossa Android Auton kautta. Apple Carplay-tuki tulossa lähiaikoina. Yle Areena näkyy auton viihdejärjestelmässä Android Auton kautta Kuva: Mikael Hindsberg / Yle autot,media,Yle Areena,Android Auto,Auton viihdejärjestelmät

On mielenkiintoista nähdä kuinka tämä tulee vaikuttamaan myös muiden tuotteiden valinnoissa. Jakaantuuko markkina eri assistenttejä tukeviin älytelkkareihin, valaistuksiin, robottipölynimureihin ja vaikka älyjääkaappeihin?

Vai tuleeko kehitys viemään assistentteja lähemmäksi toisiaan niin ettei lopuksi ole niin suurta ero minkä kanssa puhut. Ja kaikki löytyy kuitenkin integroituna kaikista laitteista? Ainakin teknisen kehityksen myötä ymmärrys paranee ja lähenee toisiaan kun NLP-mallit kehittyvät ja alkavat saamaan kiinni puheen merkityksistä yhä paremmin. Googlen Meena on tästä tuorein esimerkki.

Mutta silti ekosysteemejä voidaan myös datatasolla pitää erillään. Tällöin kaikkien omistamasi laitteiden tulee tukea samaa ekosysteemiä jotta assistentit toimisivat älykkäästi.

Begun the assistant wars have?

  • Chat Beyond The Grave

    Proof of concept for ML-based content.

    Yle Beta exists to try out improbable projects. This article is the post mortem of a one which I still don't completely know what it was all about.

  • The Dead Are Speaking - kokoillan audiodraama älykaiuttimelle

    Tietoa The Dead Are Speaking pelistä.

    The Dead Are Speaking on puheohjattu, epälineaarinen audiodraama Google Home -älykaiuttimelle. Pelaaja pääsee keskelle 30-luvun Helsinkiä selvittämään pahamaineista Tattarisuon ruumismysteeriä sanomalehtitoimittajan roolissa. Tarina on saanut innoituksensa tositapahtumista, mutta materiaalina on käytetty myös tapahtumiin liittyneitä värikkäitä huhuja.

  • The Dead Are Speaking - A Feature-length Audio Drama for Smart Speakers

    Information about The Dead Are Speaking smart speaker game.

    The Dead Are Speaking is a voice-controlled, non-linear audio drama for Google Home smart speakers. In the game, the player takes a role of a newspaper journalist in Helsinki of the 30s, asked to investigate a notorious Tattarisuo body part mystery. The story is inspired by a real life events, but also by juicy rumors around the event.

Lue myös - yle.fi:stä poimittua

Yle Beta

Jos sinulla on idea jota haluaisit kokeilla kanssamme tai haluaisit kuulla lisää Yle Betasta, ota yhteyttä!


Tai lähetä sähköpostia info.beta@yle.fi.
  • Chat Beyond The Grave

    Proof of concept for ML-based content.

    Yle Beta exists to try out improbable projects. This article is the post mortem of a one which I still don't completely know what it was all about.

  • Teknologian vastuullisuus, onko sitä? - Tervetuloa Ylen Kånehuone-podcastiin!

    Teknologiavisiotiimi esittää.

    Nosta konepelti ylös ja sukella mukaan Ylen Teknologia- ja kehitysyksikön toimintaan. Kånehuone -podcastissä tavataan mielenkiintoisia ja ajankohtaisia vieraita niin Ylestä kuin talon ulkopuolelta. Yhdessä vieraiden kanssa pohditaan teknologian tulevaisuuden haasteita myös hieman erikoisemmista näkökulmista katsottuna.

  • The Dead Are Speaking - A Feature-length Audio Drama for Smart Speakers

    Information about The Dead Are Speaking smart speaker game.

    The Dead Are Speaking is a voice-controlled, non-linear audio drama for Google Home smart speakers. In the game, the player takes a role of a newspaper journalist in Helsinki of the 30s, asked to investigate a notorious Tattarisuo body part mystery. The story is inspired by a real life events, but also by juicy rumors around the event.

Uusimmat sisällöt - Yle Beta

  • Teknologian vastuullisuus, onko sitä? - Tervetuloa Ylen Kånehuone-podcastiin!

    Teknologiavisiotiimi esittää.

    Nosta konepelti ylös ja sukella mukaan Ylen Teknologia- ja kehitysyksikön toimintaan. Kånehuone -podcastissä tavataan mielenkiintoisia ja ajankohtaisia vieraita niin Ylestä kuin talon ulkopuolelta. Yhdessä vieraiden kanssa pohditaan teknologian tulevaisuuden haasteita myös hieman erikoisemmista näkökulmista katsottuna.

  • Chat Beyond The Grave

    Proof of concept for ML-based content.

    Yle Beta exists to try out improbable projects. This article is the post mortem of a one which I still don't completely know what it was all about.

  • The Dead Are Speaking - kokoillan audiodraama älykaiuttimelle

    Tietoa The Dead Are Speaking pelistä.

    The Dead Are Speaking on puheohjattu, epälineaarinen audiodraama Google Home -älykaiuttimelle. Pelaaja pääsee keskelle 30-luvun Helsinkiä selvittämään pahamaineista Tattarisuon ruumismysteeriä sanomalehtitoimittajan roolissa. Tarina on saanut innoituksensa tositapahtumista, mutta materiaalina on käytetty myös tapahtumiin liittyneitä värikkäitä huhuja.

  • The Dead Are Speaking - A Feature-length Audio Drama for Smart Speakers

    Information about The Dead Are Speaking smart speaker game.

    The Dead Are Speaking is a voice-controlled, non-linear audio drama for Google Home smart speakers. In the game, the player takes a role of a newspaper journalist in Helsinki of the 30s, asked to investigate a notorious Tattarisuo body part mystery. The story is inspired by a real life events, but also by juicy rumors around the event.

  • Emma1234 -peliä voi pelata mainoksessa

    Yle Beta tutkii Emma1234-pelin julkaisua mainoksessa.

    Emma1234-peli on mediakasvatuksellinen etsivätarina, joka tapahtuu kuvitteellisessa sosiaalisen median ympäristössä. Yle Beta on mukana pelin julkaisussa, koska se on epätavanomainen - tutkimme vuorovaikutteisen sisällön toimivuutta suoraan Snapchat- ja Instagram-mainoksessa.

  • Ääniohjauksen tulevaisuusnäkymät Suomessa

    Kielitukea odotellaan vielä, mutta muuten etenee nopeasti.

    Älykaiuttimien kielitukea odotellaan osin vielä, mutta muuten kehitys etenee nopeasti. Ja ääniohjaus tulee monelta eri suunnasta yhä lähemmäs arkea.

  • Ilmees ku: Empaattista tarinankerrontaa lisätyn todellisuuden avulla

    Ilmees ku -kokeilu testasi tarinankerrontaa AR-peilissä.

    Toukokuussa 2018 toteutimme Yle Sandbox kokeilun nimeltä Ilmees ku, jossa tutustuttiin Facebook-sovelluksen kamerassa toimivaan, lisättyä todellisuutta hyödyntävään, omilla kasvoilla tapahtuvaan tarinankerrontaan. Sopan ymmärtäminen vaatii hieman pureskelua, mutta helpoimmalla pääsee jos vain avaa kokeilun osoitteessa yle.fi/ilmeesku!

  • Teknologia viekoittelee unohtamaan inhimillisyyden - teknologian ilmiökartta maaliskuussa 2019

    Ajatuksiamme huomionarvoisista teknologian ilmiöistä.

    Tulevaisuus muuttaa muotoaan. Se ei ole vielä toteutunut ja silti se on jo muuttunut. Näkymä 2020-luvun arkeen on kiehtova ja samalla kysymyksiä herättävä. Vieko teknologia ihmiskuntaa vai ohjaako inhimillisyys teknologiaa? Katso tuoreimpia ajatuksiamme teknologian ilmiöistä, joilla on merkitystä - ihmiskunnalle, medialle ja Ylelle.

  • Social Robotics -kokeilu keskuskirjasto Oodissa 23.1.2019

    Mitä opimme IQ_201 robotin Minecraft-pelailusta?

    Sosiaalinen robotti on kone, joka pyrkii luonnollisen oloisen vuorovaikutuksen keinoin vaikuttamaan niihin samoihin hormoneihin ja neuroneihin, jotka aktivoituvat kun me ihmiset olemme vuorovaikutuksissa toistemme kanssa. Yle Beta oli vuoden vaihteessa mukana Futuricen hankkeessa, jossa haluttiin testata robottien tunnetaitoja tosielämässä.