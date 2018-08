Yhdysvaltalainen terroristi Unabomber, oikealta nimeltään Theodore John Kaczynski, jäi vuonna 1996 kiinni parikymmenvuotisen etsinnän jälkeen pitkälti niiden kirjeiden ja julistusten perusteella, joita hän oli lähettänyt sanomalehtiin. Häntä ei lopulta paljastanut kirjoitustensa sisältö eivätkä edes epätavalliset sanat, vaan aivan tavallisten sanojen toistumisrytmi.

Hänen jäljittämisessään käytetty menetelmä on nimeltään stylometriikka, tai rikostutkimuksen termein forensinen kielentutkimus.

Sen perusajatus on, että jokaisen kirjoittajan tyyli – sanavalinnoista rakenteisiin – on miltei yhtä yksilöllinen kuin hänen sormenjälkensä tai DNA:nsa, kunhan sovelletaan kyllin perusteellisia tilastollisia menetelmiä ja nykyisin tietenkin nopeita tietokoneita.

Hämääminen on hyvin vaikeaa

Vaikka stylometriikan todennäköistä aineistoa ovat väärennöksiksi epäillyt testamentit, menetelmällä on monta käyttöä. Se otettiin apuun silloinkin, kun nimetön vinkkaaja oli kertonut brittilehdille, että dekkarimarkkinoille ilmestynyt uusi kirjailija Robert Galbraith oli todellisuudessa Harry Potter -kirjailija J. K. Rowling.

Sellaiset pienet sanat kuin "mutta" tai germaanisten kielten prepositiot – esimerkiksi "of" – ja artikkelit – kuten "the" – ovat hyvin paljastavia, sanoo Galbraith/Rowling-tutkimukseen osallistunut yhdysvaltalaisen Duquesnen yliopiston professori Patrick Juola. Hän on alansa arvostetuimpia tutkijoita.

Pienten merkityksettömiltä näyttävien sanojen käyttö on erittäin yksilöllistä, ja sitä on todella vaikea vaihdella, koska ne tulevat alitajunnasta, Juola kertoi Time (siirryt toiseen palveluun)-lehdessä Galbraith/Rowling-tutkimuksen jälkeen.

Kotimaisten kielten keskuksen Kielikello-lehdessä 4/2014 (siirryt toiseen palveluun) on pitkä suomalainen artikkeli forensisesta kielentutkimuksesta.

Kovaksi keitetyn salapoliisin Cormoran Striken luojaksi osoittautui J. K. Rowling. Martin Pettitt / CC BY 2.0

Beatles-innostus poiki tutkimuksen

Kaksi pohjoisamerikkalaista tutkijaa päätti soveltaa stylometriikkaa sävellyksiin ratkaistakseen, kenen käsialaa ovat ne Beatles-kappaleet, joiden tekijäksi on merkitty Lennon-McCartney, mutta joiden varsinaisesta isyydestä tekijöillä itsellään oli eri muistikuva.

Hanke virisi leikkimielellä tilastotieteilijöiden konferenssissa (siirryt toiseen palveluun), jossa tilastotieteen yliopistolehtori Mark Glickman yhdysvaltalaisesta Harvardin yliopistosta ja matematiikan professori Jason Brown kanadalaisesta Dalhousien yliopistosta huomasivat, että heitä yhdisti intohimo Beatles-musiikkiin.

Useimmat Lennon-McCartney-merkinnän saaneet kappaleet ovat syntyneet John Lennonin ja Paul McCartneyn yhteistyönä tai tekijäksi tiedetään jompikumpi, mutta yllättävän monien säveltäjä on epäselvä.

Sellainen on muun muassa In My Life (siirryt toiseen palveluun) vuodelta 1965. Sekä Lennon että McCartney pitivät sitä omana tuotoksenaan. Niinpä se oli yksi kohde, johon stylometriikan tehoa sopi koettaa, kertoo Glickman.

Analyysiin pantiin 149 osatekijää

Yksi kappale ei tietenkään riittänyt, vaan tarvittiin vertailupohjaa. Clickman, Brown ja Harvardin yliopistossa tilastotiedettä opiskeleva Ryan Song purkivat kaikki vuosien 1962–1966 Beatles-sävellykset alkutekijöihinsä ja jaottelivat ne sen mukaan, miten usein tietyt piirteet kussakin esiintyvät.

Glickman vertaa menetelmää siihen, miten valovärit määritellään niissä olevan punaisen, sinisen ja vihreän mukaan. Tutkijat tekivät lauluille samoin, mutta tekijöitä oli paljon enemmän, kaikkiaan 149 osatekijää.

Tälläkin Beatles-kappaleella on virallisesti kaksi tekijää. Se on Paul McCartneyn käsialaa. CC0

Ensimmäiset kategoriat saatiin siitä, miten usein yleiset ja toisaalta harvinaiset soinnut toistuvat. Sitten vastaava luokittelu tehtiin solistin laulamista nuoteista. Kolmannessa joukossa olivat siirtymät soinnusta toiseen, ja neljäntenä luokiteltiin melodian nuottiparit.

Lopuksi laulu jaettiin neljän nuotin jaksoihin ja katsottiin, onko seuraava nuotti kussakin edellistä ylempi vai alempi vai pysyykö se samana.

Näitä viittä kategoriaa pidettiin hyvänä työkaluna, koska vanhastaan tiedetään, että Lennonin säveltämissä kappaleissa melodia on varsin vakaa.

– Otetaan esimerkiksi vaikka Help! (siirryt toiseen palveluun) Sen sävelkorkeus ei juurikaan vaihtele. Sama nuotti toistuu ja muuttuu vain lyhyin askelin. Mutta McCartneylla, esimerkiksi Michellessä (siirryt toiseen palveluun), sävelkorkeus kulkee sinne ja tänne, Glickman sanoo.

80-prosenttinen varmuus

Kun kertyneestä tiedosta laskettiin ehdollinen todennäköisyys tilastotieteellisesti Bayesin teoreeman perusteella, In My Life osoittautui jokseenkin varmasti Lennonin työksi. Toisaalta The Word (siirryt toiseen palveluun), jota Glickman piti alkujaan Lennonin säveltämänä, on hyvin todennäköisesti McCartneyn tekemä.

Tarkkuus niihin kappaleisiin verrattuna, joiden tekijästä oli vanha varmuus, on 80-prosenttinen, tutkijat sanovat.

Mutta oliko tutkimus pelkkää hauskaa musiikillista salapoliisipuuhastelua, vai onko sillä muutakin merkitystä? Glickmanin mukaan on kyllä. Menetelmää jatkamalla pystytään selvittämään, miten tyylivaikutteet ovat kulkeutuneet popmusiikin historiassa, hän sanoo.

