Hyppää sisältöön

Twitter ja Tiktok avaavat algoritmejaan avoimuuden nimissä, mutta mitä lähdekoodi oikeasti paljastaa palvelusta?

Lähdekoodin avaaminen tai algoritmien auditointi lisäävät läpinäkyvyyttä, mutta ne eivät ole ainoita keinoja ymmärtää some-palveluiden toimintamekanismeja, sanoo tutkija Matti Nelimarkka.

Tik Tok yhtiön logo puhelimen ruudulla. Taustalla näkyy lähdekoodia.
Tiktok on luvannut avata suosittelualgoritmejaan ulkopuolisten tarkasteltaviksi. Tällä yhtiö pyrkii vakuuttamaan länsimaiset päättäjät, ettei palvelu manipuloi sisältöjään Kiinan kommunistista johtoa suosivaan suuntaan. Kuva: Jonathan Raa / NurPhoto / AOP
Teemu Hallamaa

Pari viikkoa sitten viestipalvelu Twitter julkaisi osan lähdekoodistaan internetiin. Kiina-yhteyksien vuoksi suurennuslasin alle Yhdysvalloissa ja Euroopassa joutunut videosovellus Tiktok on luvannut avata algoritmejaan ulkopuolisten tarkasteltaviksi. Molemmat palvelut lupaavat, että lähdekoodista löytyy ratkaisu niin puolueellisuus- ja manipulointisyytöksiä vastaan.

Algoritmeja yhteiskunnallisena toimijana tutkinut Matti Nelimarkka Helsingin yliopistosta ja Aalto-yliopistosta ei ole vakuuttunut Twitterin ja Tiktokin pyrkimyksistä.

– Iso ongelma tässä on se, että lähdekoodin avaaminen ei itsessään välttämättä hirveästi valota sitä palvelun toimintaa, Nelimarkka sanoo.

Esimerkiksi Twitterin avaamasta lähdekoodista voi päätellä, että tykkäykset saavat suosittelualgoritmin näyttämään tykätyn twiitin useammalle käyttäjälle. Videon tai kuvan liittäminen näyttää lisäävän suosittelua. Koodista voi havaita, että tiettyjen merkittävien tilien twiittien näkyvyyttä lisätään keinotekoisesti.

– Nämä eivät ole salaisuuksia. Yleisellä tasolla Twitterin suosittelualgoritmin toiminta ei ole monelle hirveä yllätys, Nelimarkka toteaa.

Nelimarkka painottaa, että sosiaalisen median sivustoja tarkasteltaessa lähdekoodi on vain yksi osa kokonaisuutta. Yhtä merkittävä rooli on esimerkiksi datalla, jota sivustolla pyörii.

Ilman dataa avoimuus jää puolitiehen

Algoritmeja on usein kuvailtu keittokirjoiksi tai resepteiksi, joita sovellus noudattaa.

Lähdekoodin avaaminen on kuin kurpitsakeittoreseptin esittäminen kokille, joka ei ole koskaan nähnyt kurpitsaa, Nelimarkka jatkaa vertausta. Kun ohjeissa neuvotaan kuorimaan kurpitsa, ongelmat alkavat heti.

– Siinä on vaikea hahmottaa, onko nämä isoja vai pieniä paloja.

Ilman dataa lähdekoodin lukeminen on tällaista. Merkityksiä ja seurauksia on vaikea hahmottaa pelkistä ohjeista. Lisäksi lähdekoodissa voi olla oudolta näyttäviä sääntöjä, joiden syyt vaativat laajempaa kontekstia.

Tästä syystä Tiktokin suunnittelemat avoimuuskeskukset, joihin esimerkiksi poliitikot voivat tulla tarkastelmaan palvelun lähdekoodia, kuulostavat Nelimarkan korviin surkuhupaisilta.

– Sinne tulee sitten kansanedustajia katsomaan ja toteamaan, että hyvin tämä lähdekoodi toimii? Nelimarkka ihmettee.

Hän huomauttaa, että vaikka päättäjillä olisi osaamista ohjelmistokielistä, lähdekoodi ei ole aina paras tapa tutkia sivuston toimintaa.

Lähdekoodin sijaan internetpalveluiden toimintaa voi valottaa keräämällä niistä tietoja muilla tavoilla. Nelimarkka nostaa esille Googlen hakukoneen, jonka toimintaa tutkitaan jatkuvasti. Google ei ole julkaissut lähdekoodiaan, mutta hakukoneen toimintaperiaatteet ovat Nelimarkan mukaan silti hyvin tiedossa.

– Meidän ei tarvitse nähdä reseptiä maistaaksemme keitosta valkosipulin, Nelimarkka sanoo.

Matti Nelimarkka nojaa kaiteeseen Tiedekulman portaikossa.
Yliopistonlehtori Matti Nelimarkka ei usko, että lähdekoodin osittaisella avaamisella olisi isoa haittaa Twitterille. Kuva: Jussi Koivunoro / Yle

Musk laittaa rajapinnat kiinni

Algoritmien maistelu ulkopuolelta käsin on viime aikoina kuitenkin vaikeutunut. Esimerkiksi somejätti Facebook on suhtautunut aggressiivisemmin tutkimuksiin, joissa yhtiön palveluiden toimintamekanismeja on pyritty avaamaan keräämällä käyttäjiltä itseltään dataa.

Sama ilmiö on nähtävissä Twitterissä. Samaan aikaan, kun Elon Musk esittelee Twitterin lähdekoodia, yhtiö on sulkemassa rajapintoja, joiden kautta tutkijat ovat voineet kerätä tietoja Twitteristä. Twitter on ilmoittanut sulkevansa tai tekevänsä maksullisiksi osan rajapinnoistaan.

Rajapinnat ovat liittymäpintoja, joiden kautta sovellukset ja sivustot keskustelevat keskenään. Esimerkiksi twiittien upottaminen sivustolle vaatii sitä varten rakennetun rajapinnan.

Twitterin suunnitelmissa rajapintojen käytöstä aletaan veloittaa summia, jotka sulkevat valtaosan tavallisista akateemisista hankkeista Twitterin datan ulkopuolelle. Julkisuudessa on esiintynyt tieto, että pääsy Twitterin dataan maksaa jatkossa 42 000 dollaria kuussa.

– Nyt olen esimerkiksi tutkimusprojektissa, jossa me epätoivoisesti yritämme kerätä dataa talteen ennen kuin se muuttuu maksulliseksi, koska meillä ei ole siihen varaa, Nelimarkka kertoo.

Jos Nelimarkka saisi valita, hän ottaisi mieluummin avoimet rajapinnat kuin avoimet lähdekoodit.

Pientä toivoa tutkijoille tuo se, että Muskin aikana Twitter on ilmoittanut monista muutoksista, jotka ovat lopulta kuivuneet kasaan tai lykkääntyneet useita kertoja.

Lähdekoodin avaaminen on myös pr-tempaus

Nelimarkka pitää joka tapauksessa Twitterin päätöstä avata osan lähdekoodistaan rohkeana, joskaan ei ennenkuulumattomana.

– Kyllähän lähdekoodeja maailmasta löytyy, mutta se, että yritys haluaa avata koodinsa ja näyttää maailmalle, että näin se toimii, on aika poikkeuksellista, Nelimarkka sanoo.

Yleensä lähdekoodin avaamisen taustalta löytyy kaksi syytä.

Joskus ohjelmiston ylläpitäminen lakkaa olemasta tärkeää sen kehittäneelle yhtiölle. Tällöin yhtiö voi luopua ohjelmiston ylläpidosta avaamalla lähdekoodin kaikille. Näin ohjelmistoa yhä käyttävät tahot voivat jatkaa sen hyödyntämistä.

Toinen syy avata lähdekoodi on ekosysteemin rakentaminen. Yhtiö haluaa, että muut kehittäjät rakentavat ominaisuuksia ja ohjelmistoja juuri sen omalle alustalle. Avoin lähdekoodi tekee ekosysteemiin liittymisestä helpompaa.

Esimerkiksi Googlen Android-mobiilikäyttöjärjestelmä on avoimen lähdekoodin ohjelmisto, joka puolestaan perustuu avoimen lähdekoodin Linux-käyttöjärjestelmään. Tämän vuoksi Samsungin puhelimissa oleva käyttöjärjestelmä on hieman erilainen kuin Xiaomin tai Motorolan puhelimissa, vaikka kaikki ovat Android-puhelimia.

Kumpikaan näistä syistä ei tunnu pätevän Twitteriin. Ennen virallista julkaisua Twitterin lähdekoodi ehti osittain vuotaa nettiin, mutta tälläkään tuskin oli tekemistä avaamispäätöksen kanssa.

Nelimarkka uskoo, että lopulta kyse on pr-kampanjasta.

– Taas me juttelemme Twitteristä, hän toteaa.

Kuuntele Yle Areenasta:

Tiedeykkösessä algoritmien valtaa pohtivat apulaisprofessori Minna Ruckenstein Helsingin yliopistosta ja tutkija Matti Nelimarkka Helsingin ja Aalto yliopistosta sekä teknologiayrittäjä Maria Ritola. Toimittaja on Teija Peltoniemi. Julkaistu tammikuussa 2021.

Suosittelemme