Uusi tekniikka auttaa äänittämään laulua kännykällä katumelun keskellä

Sovellukset voivat viedä mobiiliäänitykset ihmiskorvan tasolle. Äänen erottelua on tutkittu Tampereen Teknillisessä Yliopistossa perjantaina tarkastettavassa väitöstutkimuksessa.

tekniikka
Audiotutkija työpöytänsä ääressä
Audiotutkija Joonas Nikunen tuo äänitallennusta lähemmäs ihmiskorvan lajittelutaitoa. Tarvitaan vain vielä kaupallinen sovellus, jolla se tuodaan tavallisen käyttäjän tavoitettavaksi.Mauri Tikkamäki / Yle

Mobiililaitteineen häsläävä keskivertokansalainen ei useinkaan saa selkeitä äänitallenteita, kun puhe ei kuulu tai katusoittajan soolo hukkuu taustalla olevaan liikenteen meteliin.

Uusi tekniikka saattaa tuoda parannuksen tähänkin. Tutkimustuloksia on, mutta tarvitaan vielä kaupalliset sovellukset.

Ääniä voidaan erotella

Tutkimuskammiossa Tampereen Teknillisellä Yliopistolla Joonas Nikunen näyttää esimerkin, jossa monta ihmistä puhuu samassa tilassa. Paikan päällä ihmisen valikoiva kuulo osaa poimia tarpeellisen tiedon, mutta tallenteelta kuunneltuna ääni on kakofoniaa. Sitten käytetään Nikusen sovellusta. Halutessaan hän voi poimia yksittäisen puhujan äänen oleellisesti selkeämmin.

Kyse on uudesta tekniikasta, jota on parisen vuotta kehitelty TTY:n tieto- ja sähkötekniikan tiedekunnassa. Työ on osa diplomi-insinööri Nikusen jatko-opintoja.

Vähintään kolme mikkiä

Äänikoe on äänitetty tarkoitusta varten viritetyllä pikkulaatikolla, jossa on kolme mikrofonia.

Sovellusta voisi ajatella vaikka mobiililaitteisiin selkeämmän äänitallenteen saamiseksi.

Joonas Nikunen

– Kyse on ”ihmiskuulon kaltaisen idean objektipohjaisuudesta äänisignaalien esittämisessä”, selittää Nikunen. Siinä "koneoppiminen yhdistetään ääniobjektien tulosuuntaan”.

Tämä on tiedettä.

Ehkä maallikko ymmärtää paremmin sen osan, jossa puhutaan mikrofonien määrästä. Niitä pitää olla vähintään kolme. Tämä siksi, että juuri äänen suunta on tärkeä kun äänilähteitä erotetaan toisistaan.

Sovelluksille on tarvetta

Päällekkäisten äänilähteiden erottelemiseen on tarvetta. Puheentunnistimille se on vielä jokseenkin mahdotonta.

– Sovellusta voisi ajatella vaikka mobiililaitteisiin selkeämmän äänitallenteen saamiseksi, sanoo Nikunen.

Myös isojen äänitiedostojen tehokkaammalle pakkaamiselle on kysyntää.

– Tutkimus tuo audiosignaalin esittämiseen uusia tapoja – esimerkkinä vaikka isojen soundtrack-kokonaisuuksien koodaaminen.

Näitä sovelluksia esitetään Joonas Nikusen perjantaina 16. tammikuuta TTY:llä tarkastettavassa väitöskirjassa.