Suomalaisten kaikki nettituotokset julkaistaan kootusti

Kansalliskirjasto aloitti kolme vuotta sitten valtavan urakan, jonka tarkoituksena on tallentaa vuosittain lähes kaikki suomalainen verkkomateriaali. Nyt kerätty nettiaineisto tulee myös kansalaisten nähtäväksi, kun huhtikuun alussa Kansalliskirjastossa avautuu kaksi työpistettä arkiston tutkimiseen.

Kotimaa

Suunnitelmista netin suomalaismateriaalin keruusta on puhuttu jo 1990-luvun puolivälistä saakka, mutta vasta tekijänoikeuslain uudistus kolme vuotta sitten mahdollisti Kansalliskirjastolle nettimateriaalin tallentamisen. Nyt viime vuoden alusta voimaan tullut laki kulttuuriaineistojen tallettamisesta ja säilyttämisestä velvoittaa Kansalliskirjaston hakemaan ja tallentamaan kaikki suomalaisilla palvelemilla sijaitseva julkinen aineisto sekä ulkomailla sijaitseva erityisesti suomalaiselle yleisölle tarkoitettu materiaali.

Vaatimus on kuitenkin mahdoton toteuttaa jo teknisten hankaluuksien vuoksi. Tällä hetkellä robotti ei esimerkiksi pysty haravoimaan sivuja, jotka ovat maksullisia tai kaipaavat rekisteröitymistä, vaikka ne kuuluvatkin lain piiriin.

- Käytännössä voi sanoa, että nämä keräykset ovat kaikenkattavia. Määrätkin ovat niin suuria, että meillä ei ole mitään mahdollisuuksia ruveta käymään sisältöjä läpi ja arvioimaan, mitä säilytetään ja mitä ei, kertoo Kansalliskirjaston verkkoarkiston pääsuunnittelija Esa-Pekka Keskitalo.

Tänä vuonna Kansalliskirjasto tallentaa noin 60 miljoonaa tiedostoa, ja määrän odotetaan kasvavan lähivuosina rajusti.

Arkistointia tutkijoiden tarpeisiin jo vuodesta 1707

Kansalliskirjasto alkoi tallentaa kuninkaan määräyksestä kaikkia valtakunnassa julkaistuja painettuja teoksi vuodesta 1707 alkaen. Maan kaikkien kirjapainojen tuli luovuttaa yksi kappale kaikkia painamiaan teoksia Turun akatemialle, joka edelsi Kansalliskirjastoa. Nykyään verkko on julkaisukanava siinä missä painetut viestimetkin.

- Verkossa on yhä suurempi osa julkaistuista kulttuuriperinnöstä. Se on erittäin tärkeä osa suomalaista identiteettiä ja tietenkin elintärkeä tulevaisuuden tutkijoiden tutkimuksen lähdemateriaaliksi. Uutiset ja muut saadaan talteen helposti, ja ne säilyvät muitakin kanavia pitkin, mutta kaikki tällainen hyvin arkinen toiminta kiinnostaa eniten, Keskitalo pohtii.

Tyypillisesti tutkijoita kiinnostaa Keskitalon mukaan ihan tavallisten ihmisten blogit, koska juuri ne tarjoavat hyviä ajankuvia.

Verkkoarkisto on rajatusti julkinen

Verkkoarkisto palvelee siis eniten tutkijoita, mutta kuka tahansa pystyy käyttämään arkistoa. Kotikoneelta arkistoa ei kuitenkaan pysty selailemaan, vaan aineisto on rajatusti käytössä muutamilla työpisteillä. Huhtikuun alusta alkaen Kansalliskirjastossa avautuu kaksi työpistettä verkkoarkiston tutkimiseen. Myöhemmin ympäri suomea ilmaantuu samanlaisia työasemia. Koneilta ei pysty tallentamaan digitaalisia kopioita, mutta paperitulosteita voi halutessaan ottaa.

- Meidän tarkoitus ei tietenkään ole olla julkaisija, ja tätä aineistoa ei julkaista uudestaan. Tässä on ennen kaikkea tekijänoikeudelliset kysymykset taustalla, Keskitalo kommentoi tilannetta.

Hakukoneet ja muut tahot tallentavat tietoja verkosta koko ajan. Siksi nettiin kerran tallennettu tieto on lähes mahdotonta poistaa sieltä. Omien kotisivujen arkistoon joutumista sureville Keskitalolla on selkeä viesti.

- Jos aineisto on tullut Kansalliskirjaston haravaan, niin se on kyllä talletettuna hyvin todennäköisesti jonnekin muuallekin nettiin. Eli kannattaa kyllä miettiä ja olla huolellinen sen suhteen minkälaisia asioita verkossa julkaisee.

Kansalliskirjasto lienee yksi harmittomimmista tekijöistä, jotka tallentavat ihmisten tietoja verkosta. Jos kuitenkin tallennetulle sivulle on jäänyt henkilötunnus tai muu arkaluontoinen tieto, niin yhteydenotolla Kansalliskirjastoon tieto voidaan poistaa verkkoarkistosta.

Lähteet: YLE Uutiset / Erkka Mikkonen