Hyppää pääsisältöön

Lahjoita puhetta ja ole mukana Suomen suurimmassa yksittäisessä puheenkeräyshankkeessa sitten Kalevalan

Lahjoita puhetta -kampanja kerää 10 000 tuntia vapaasti puhuttua suomen kieltä. Mutta miksi koko Suomi on saatava puhumaan 10 000 tuntia? Koska yhdessä voimme opettaa puhuvat älylaitteet ja robotit oikeasti ymmärtämään suomea.

Lahjoita puhetta tästä!

Jokaiselle tuttu tunne: Pankin asiakaspalvelurobotin kanssa ei tiedä itkeäkö vai nauraa.

Puhuvat älylaitteet yleistyvät, mutta suomen kieltä ne raukat eivät kunnolla ymmärrä.

Pienenä kielialueena emme voi olettaa kansainvälisten teknologiajättien yksin huolehtivan suomen kielen toimivuudesta tulevaisuuden teknologioissa.

Ratkaisu on yllättävän yksinkertainen: kerätään suomalaisten puhetta ja hoidetaan homma itse! Ei tässä ennenkään ole jääty tuleen makaamaan.

Tavoitteena on kerätä 10 000 tuntia suomalaisten puhetta tekoälyn kehittäjien käyttöön. Puhepankkiin tarvitaan savolaesten viäntöä, stadin slangii, raumlaissi jaarituksi ja pohojalaasten asiaa ja tietenkin myös muualla kasvaneiden omanlaistaan suomea – Hangosta Utsjoelle kaikkien murrealueiden edustajien pulinoita mahdollisimman kirjava kattaus!

Näin tulevaisuuden tekoäly myös ihan oikeasti ymmärtää tätä meidän rikasta ja monenlaista tapaamme puhua suomea.

Puhepankin avulla hoivarobotti tulevaisuudessa hoksaa, että kyse ei ole linnuista, kun sille sanotaan, että “pitäs pestä käet”.

Voit lahjoittaa puhettasi sivulla lahjoitapuhetta.fi tai lataamalla sovelluskaupoista mobiilisovelluksen Androidille tai iOSille.

Mikä hanke Lahjoita puhetta on?
Hankkeen taustalla ovat Valtion kehitysyhtiön Vake Oy, Helsingin yliopisto, Aalto Yliopisto, Turun Yliopisto ja Yle. Mikä hanke Lahjoita puhetta on? Kuva: Yle / Annukka Palmén-Väisänen Lahjoita puhetta

Lahjoita puhetta -hanke vastaa suuruusluokaltaan kuin Kalevalan tai kansanrunouskokoelman aineistojen keruuta.

Hankkeessa kerätään tuntimääräisesti laajin yksittäistä tutkimusaihetta varten kerättävä puheaineisto. Kalevalaan kerättiin aineistoa kulkemalla kylistä toiseen jalan, uusi aineisto kerätään digitaalisesti verkossa. Toteutuessaan 10 000 tunnin puhepankki on kuin kirjasto, kun tähän asti tekoälyn kehittäjillä on ollut käytettävissään korkeintaan muutamia yksittäisiä kirjoja.

Suomalaisilta on toki kerätty useita suuria puheaineistoja tutkimustarpeisiin Kalevalan jälkeen. Äänitteitä on esimerkiksi Suomen kielen nauhoitearkistossa, joka on tiettävästi maailman suurin kielitieteellinen äänitekokoelma, kaikkiaan yli 24 000 tuntia puheaineistoa, josta suuri osa on nimenomaan suomen murteita ja puhekieltä. Äänitteitä on kuitenkin kerätty eri kokoelmiin ja hankkeisiin monen vuosikymmenen ajan, ja ne ovat aiheiltaan erityyppisiä.

Aiempien puheaineistojen rajoitteena kuitenkin on se, että näitä ei voi käyttää kuin tieteelliseen tutkimukseen, eivätkä ne siis sovellu kaupalliseen käyttöön tulevan puheentunnistuksen kehittämiseen.

Hankkeen taustalla ovat Valtion kehitysyhtiön Vake Oy, Helsingin yliopisto, Aalto Yliopisto, Turun Yliopisto ja Yle. Kampanjaan haastetaan mukaan myös yhteiskunnan eri toimijoita. Ylen rooli on tehdä kampanjaa tunnetuksi ja lahjoitapuhetta.fi-sivustolla on sovellus, jossa jokainen voi purkaa sydäntään mielin määrin. Puhepankin aineistot tallennetaan yliopistojen Kielipankkiin.

Älylaitteiden puheentunnistus perustuu aitoon puheeseen. Mitä suurempi ja monipuolisempi on niiden pohjana oleva puheaineisto – epätavallisuuksineen, epäselvyyksineen ja epäröinteineen – sitä parempi siitä tulee. Voi sanoa, että jokainen omaperäisesti lausuttu sana on puhepankissa ainutlaatuinen aarre.

Voit lahjoittaa puhettasi sivulla lahjoitapuhetta.fi tai lataamalla sovelluskaupoista mobiilisovelluksen Androidille tai iOSille.

Pulisijan pikaohje

  1. Virheitä ei ole!
  2. Änkytykset ja epäröinnit ovat vain plussaa, sillä sitähän puhekieli on. Puheentunnistuksen kompastuskivinä kun tavallisesti ovat juuri sanat öö, ää tai niinku. Nyt opetetaan tekoäly ymmärtämään, miltä harkitseminen kuulostaa.

  3. Aikarajaa ei ole!
  4. Saat saarnata, vaahdota, palpattaa ja pölpöttää niin pitkään kuin vain sielu sietää.

  5. Avaa murrehanat!
  6. Mitä enemmän puhepankkiin kertyy ainutlaatuisia murteitamme, sitä paremmin tekoäly murteita ymmärtää myös digiaikana.


Tietosuojasi on meille tärkeää

Puhettasi eivät pääse kuuntelemaan muut kuin tekoälyn tutkijat ja kehittäjät. Yle ei saa puhettasi käyttöönsä, eikä hankkeessa kerätä henkilötietoja, joista puhujan voi tunnistaa. Puheentunnistamisen kehittämisen kannalta on kuitenkin tärkeää tietää puhujan ikähaarukka, äidinkieli sekä mitä murrealuetta ja sukupuolta hän edustaa. Näitä taustatietoja ei voi yhdistää yksittäiseen puhujaan.

Puhettasi käytetään tekoälyn kehitykseen ja tutkimukseen sekä kielen tutkimukseen. Erityisen tärkeää toimiva, sujuva puheohjaus tulee olemaan hoitotyössä, kuten vanhustenhuollossa.

Lue lisää:

Mitä iloa paremmasta puheentunnistuksesta sinulle on Ylen asiakkaana?

Ylen palvelut paranevat, kun automaattinen puheentunnistus oppii ymmärtämään kaikenlaista suomea.

Muokattu
16.6. klo 13:40 Lisätty yhteistyökumppaneiksi Aalto Yliopisto ja Turun Yliopisto sekä tietoa aikaisemmista puheenkeräysaineistoista.
17.6. klo 11:36 Lisätty linkit mobiilisovellusten lataamiseksi.

Lue myös - yle.fi:stä poimittua