Kun kymmenen yleisradioyhtiön* porukat kerääntyivät ääniohjaus-hackathoniin kesäiseen ja lämpimään Brysseliin oli tunnelma leppoisa ja utelias. Upeista kesäkeleistä huolimatta lukkiuduttiin VRT:n ikkunattomaan studioon läppäreiden ja älykaiuttimien äärelle. Kahden vuorokauden aikana tutkittiin uusia ilmaisumuotoja ja asiakaskokemuksia ääniohjatulle medialle.

Tilaisuuden tarkoitus oli tutkia ja rakentaa äänipalveluja neljän eri teeman mukaan. Ne olivat 1) autot, 2) video, 3) tarinankerronta, ja 4) saavutettavuus. Käytännössä monet näistä sulautuivat yhteen. Ja se osoittaa myös hyvin ääniohjauksen ja yhä multimodaalisemman median vahvuuksia. Jos rakentaa palvelua tiettyyn kontekstiin painottaen vaikka tarinankerrontaa, niin samaa tuotetta pystyy hyödyntämään monessa eri kontekstissa.
Innostusta ja turhautumista vuoron perään uuden äärellä
Kokemus oli sekä innostava että välillä myös turhauttava, kuten uusien asioiden ääressä usein käy. Ääniohjaus ja sitä tukevat globaalit alustat, ensisijaisesti Amazonin Alexa ja Googlen Home, ovat vielä melko epäkypsiä alustoja. Lisäksi kielten tuessa ja toimivuudessa on merkittäviä eroja.
Esimerkiksi Belgia missä tilaisuus pidettiin ei ole Googlen virallisesti tuettu markkina-alue, vaikka maassa puhuttua hollannin- ja ranskan kieltä kyllä tuetaan. Eli tilanne on sama kun ruotsin kielen kanssa Suomessa. Ja yksi tiimi epäonnistui kokeessaan koska Googlen tuki videolle dialogisena vastauksena vielä puuttuu, vaikka näytöllisiin älykaiuttimiin panostetaan parhaillaan.
Konepuhe edelleen kovin konemaista
Englanniksi konepuhe sujuu jo melko luonnollisen oloisesti. Ja se ymmärtää myös hyvin jopa paksumpia ranskankielisiä aksentteja, jotka välillä saa kotoisan rallienglannin kuulostamaan oxfordilaiselta ääntämiseltä. :)
Ja englanniksi pystyy jo jonkin verran käsikirjoittamaan puhetta, niin että pilkutuksen, sulkujen ja lauserakenteen kautta saa hieman rytmitettyä miten kone puhuu ja vastaa. Mutta varsinaista sanapainotusta ja tunnesidonnaisia sävyjä assistantit eivät vielä osaa. Ja se tekee välttämättä koneiden puheesta monotonista ja tylsää kuunnella, muuten kuin aivan lyhyiden virkkeiden kautta.
Perus käyttökokemusta vielä tutkittava ja hiottava
Omassa ryhmässäni tutkittiin service design-menetelmien kautta uutisten ohjausta puheella. Idea oli luoda mahdollisimman yksinkertainen käyttöliittymä tuoreimpien uutisten selaamiseen. Riitti kun sanoo More (Lisää) tai Next (Seuraava) ohjatakseen uutisia. Siten esimerkiksi viisi uutista pystyi kuuntelemaan 30 sekunnissa jos kuuli pelkät otsikot. Tai kolmessa minuutissa hieman yksityiskohtaisemmilla tiedoilla.

Konseptia pystyy hyödyntämään teksti-uutisille tai hyvin strukturoiduille audio-uutisille. Se skaalautuu lisäksi hyvin ja voidaan laajentaa lisä-kuuntelua aiheiden, suositusten ja pidempien analyysien ja ohjelmien kautta. Sitä voi myös laajentaa multimodaalisesti niin että artikkelit lähetetään puhelimeen odottamaan sopivaa luku-aikaa. Tai Areenan suosikki-listaukseen sopivaa katselu- tai kuuntelu-hetkeä odotellen.
Perinteistä mediakokemusta voi parantaa ja vahvistaa uuden teknologian kautta
Yksi tiimi otti tästä kiinni ja rakensi “My TV Buddy”-sovelluksen (Minun TV-kaveri). Sitä käyttäen pystyi esimerkiksi autossa kotimatkalla jutella illan tv-ohjelmista ja tilata muistutuksen kun suosikkiohjelmasi alkaa, tai suosikkinäyttelijäsi tähdittämä elokuva alkaa.

Ruotsin SR:n porukasta koostuva tiimi otti myös kiinni perinteisestä mediasta uuden interaktiivisuuden kautta. He analysoivat suoran radiolähetyksen puhetta koneoppimisteknologialla. Ja lisäsivät siihen ohjelma-metatietoa. Kun käyttäjä sitten avasi suoran radiolähetyksen, niin hän näkee heti kuka keskustelee ja mistä aiheesta. Eli enää ei tarvitse ihmetellä että mistä tämä sinänsä mielenkiintoisen kuuloinen juttu oikein on ja ketkä siinä keskustelee? Lisäksi sai myös näkymän ajassa taaksepäin mistä aiheista äsken oli puhuttu. Ja jos haluaa hieman kelata taaksepäin päästäkseen mukaan keskustelun kulkuun pystyi tekemään sen klikkaamalla keskustelusta generoituja aihesanoja.

Hyvä tarina voittaa edelleen
Tilaisuuden voittava kokeilu oli vahvasti tarinallinen The Passenger (Matkustaja). Moniyhtiöisessä tiimissä oli myös mukana Ylen Wesa Aapro (hyvä Wesa!).
Heidän konsepti on hyvin tarinallinen. Idea on että pitkille, ja miksei myös lyhyemmille, automatkoille voi kutsua mukaan Matkustajan seuraksi. Tämä matkustaja keskustelee muiden matkustajien kanssa nimellä kutsuen, kertoo omia tarinoitaan, ja osaa myös kertoa ympäröivästä maisemasta. The Passengerin demo oli matkasta Lontoosta Edinburghiin jossa Skotlannin vuonna 1587 mestattu kuningatar Maryn haamu nousi kyytiin. Hän kertoi elämänsä kohtaloista, niskasäryistä ja haastatteli muita matkustajia niistä ja näistä.

Teknologisesti toiminnallisuus oli rakennettu Amazonin Alexalle ja hyödynsi Wikipedian Question generaattoria. Ja kuningattaren omintakeinen ääni rakennettiin käyttäen avointa tekoälytyökalua. Demo julkaistiin BBC:n sisäistä äänityökalua hyödyntäen.
Kauan eläköön kuningatar ja tarinankerronta!
* Osallistuvat yhtiöt: BBC (Iso Britannia), NPO (Hollanti), NRK (Norja), RTBF (Belgia), RTS (Sveitsi), SR (Ruotsi), SWR+BR (Saksa), VRT (Belgia), Yle (Suomi)