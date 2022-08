Jauhojengi vai jallujengi? Vai kenties jotain ihan muuta?

Sosiaalisessa mediassa on kiistelty, mitä pääministeri Sanna Marinin (sd.) juhlimisvideolla sanotaan. Videolla esiintyvät ihmiset laulavat artisti Petri Nygårdin kappaletta, jonka alkuperäiset sanat kuuluvat "hyvä juoma parempi mieli / kuiva kurkku ikenet kieli / palvon lemmyy otan hennyy".

Moni on kuitenkin kuullut, että videolla puhuttaisiin "jauhojengistä", minkä on tulkittu viittaavan huumeiden käyttöön. Osa on sen sijaan varma, että videolla lauletaan "jallujengistä". Allaolevasta tallenteesta voit itse kuunnella, mistä on kyse.

Alkuperäisessä videossa taustalla soi myös musiikkia. Ylen tallenteesta musiikki on poistuttu RX9-ohjelmalla (siirryt toiseen palveluun), joka on tekoälyyn perustuva audiorestaurointiohjelma.

Helsingin yliopiston fonetiikan professori Martti Vainio ei ole yllättynyt, että ihmiset kuulevat videon äänen eri tavalla ja ovat hyvin varmoja kokemuksestaan. Vainio korostaa, että yksittäisen ihmisen puheesta ei voi sanoa mitään varmaa, kun videolla on monta puhujaa samaan aikaan äänessä. Hän ei ota kantaa siihen, mitä Marinista julkaistulla videolla sanotaan.

– Puhe on erilaista kuin kirjoitettu kieli, jossa kirjaimet ovat aidosti eri näköisiä keskenään. Puhe on jatkuva signaali, ja äänteet voivat olla hyvin samankuuloisia. Tämän takia kuuleminen on täysin erilaista kuin jonkin tietyn kirjainjonon lukeminen.

Ennakkokäsitykset vaikuttavat tulkintaan

Vainion mukaan puhuttu kieli perustuu siihen, että tietyt rakenteet ovat toistuvia eli niillä on tietyt todennäköisyydet. Mitä suuremmalla todennäköisyydellä jotain sanaa tai äänettä seuraa jonkin tietty äänne, sitä valmiimpia olemme kuulemaan tämän tutun ja todennäköisenä pitämämme vaihtoehdon.

– Me emme myöskään tuota sitä todennäköisintä vaihtoehtoa välttämättä yhtä selvästi, koska se on tavallaan turhaa. Me säästämme energiaa ja aikaa, jolloin puhe on jo lähtökohtaisesti osittain epäselvää, Vainio kertoo.

Lisäksi odotukset ja asenteet vaikuttavat paljon siihen, mitä kuulija lopulta puheessa kuulee. Vainion mukaan niiden merkitys korostuu tilanteessa, jossa puheelle on jo ennakkoon annettu kaksi tulkintaa, kuten "jauho" tai "jallu".

– Olen melko varma, että jos testaisimme tätä ääniraitaa näillä kahdella vaihtoehdolla tässä tilanteessa, voisivat vastaukset jakautua poliittisen mielipiteen mukaan siitä huolimatta, että vastaajat toimisivat mielestään objektiivisesti.

Yle tutki ääniraitaa spektrianalyysilla

Mediat ovat julkaisseet juttuja, joissa ääniraitaa on tutkittu spektrianalyysin eli taajuusanalyysin avulla. Taajuuksien siistimisen jälkeenkin monet kuulevat silti yhä "jallun", "jauhon" tai jotain muuta riippuen siitä, mitä taajuuksia jätetään. Ylen toimittaja-äänisuunnittelija Sami Lindfors kuuluu heihin. Lindfors tutki Marinin juhlimisvideon äänitallennetta mutta ei voi varmasti sanoa, mitä sillä kuuluu.

– Jokaisen kuulo toimii vähän eri tavalla, ja me kaikki kuulemme eri taajuuksia vähän eri tavoin. Tässä tapauksessa tuntuu, että matalat taajuudet saavat minut kuulemaan "jallun" ja korkeammat "jauhon". Lisäksi kuulen selkeämmin sen vaihtoehdon, jota ajattelen jo valmiiksi päässäni.

Lindforsin mukaan myös laite, jolla ääntä kuuntelee, vaikuttaa tulkintaan. Alkuperäinen ääniraita on erittäin huonolaatuinen ja sisällöltään sekavahko, hän sanoo.

– Ääniraidalle on vaikea tehdä niin sanottua CSI-zoomausta, jossa saisimme näkyviin dataa, jota ei ole lähtökohtaisesti olemassa. Minusta tämä muistuttaa todella paljon muutaman vuoden takaista tapausta "yanny vai laurel", jossa ihmiset kuulivat saman äänitiedoston eri tavalla.