Hyppää pääsisältöön

Vuoden 2011 vaalikonetiedot nyt avoimena datana

Yle Uutisten vuoden 2011 eduskuntavaalikoneen ehdokkaiden vastausdata on nyt jaossa. Data on saatavissa Google Docs- palvelusta laskentataulukkomuodossa.

Vaalikonetieto on dokumentin ensimmäisellä välilehdellä. Toisella välilehdellä on kuvattu dokumentin sisältöä.

Tämä Ylen vaalikoneen vastauksista koostettu dokumentti julkaistaan CC-lisenssillä (CC-BY-NC-SA 3.0). Dokumentin sisältämää tietoa saa siis julkaista vapaasti ja sitä saa yhdistellä muuhun tietoon, kunhan julkaistaessa linkitetään tähän Ylen Kehitys kehittyy -blogin kirjoitukseen ja ilmoitetaan, että tiedon lähde on Yle Uutisten vaalikone 2011.

Jos huomaat tiedoissa jotakin virheitä tai dokumentti herätää kysymyksiä, kerro se kommenteissa. Kerro kommenteissa myös, mikäli olet käyttänyt dataa johonkin, mielellään linkin kera.

Julkaisemme lähiaikoina vaalikonedataa myös aiemmista vaalikoneista. Linkit muuhun Ylen avoimeen dataan tulevat toistaiseksi tähän blogiin, mutta pyrimme tekemään kokoavan dokumentin datasta beta.yle.fi-palveluun sitten, kun julkaistuja datasettejä on enemmän. 

Kommentit

Lähettänyt käyttäjä

Kiitokset tästä avoimesta julkaisusta! Tarkennetaan nyt vielä, että valittu lisenssi estää tietojen julkaisemisen tai jakelun myös kaupallisessa tarkoituksessa.

Toisaalta: Tietokannan tietojahan voi kuka tahansa pyöritellä ja murskata. Mahdolliset käppyrät tai yhteenvedot tästä datasta eivät ole tekijänoikeusasia, joten niitä voi julkaista kuten haluaa. Lisenssi rajoittaa siis itse tietokannan tietojen levittämistä, ei niistä tehtyjen johtopäätösten tms. visualisointien levitystä.

Toki datalähde on aina hyvä mainita, jottei syyllisty plagiointiin.

Tommi, luotan tässä Tarmon tulkintaan siitä, että rajoitus koskee yksin itse tietokannan levittämistä, ei siitä johdettavia visualisointeja jne. Lisäksi Helsingin Sanomat on julkaissut omaa vaalidataansa samalla lisenssillä, eikä lisenssi ymmärtääkseni ole estänyt toimintaa datan kanssa.

Kari Haakan

Lähettänyt käyttäjä

Kari, ymmärrän lisenssin samalla tavalla kuin anonyymikin: "You may not exercise any of the rights granted to You in Section 3 above in any manner that is primarily intended for or directed toward commercial advantage or private monetary compensation." on aika tiukka määritelmä käytölle. Lisenssin kohta 3 a. "to Reproduce the Work, to incorporate the Work into one or more Collections, and to Reproduce the Work as incorporated in the Collections;" sisältää juurikin tuon mashup osuuden.

-Tommi

Erkka, ideana tämän lisenssin valinnassa on lähinnä se, että kukaan ei saisi päähänsä ryhtyä kaupittelemaan tätä dataa. Mahdollisuus lienee pieni, mutta onpahan nyt ainakin sanottu, mikä datan käyttöidea on. Mashuppia ja vertailuja tämä ei oman tulkintani (en ole juristi) mukaan estä. Tarkoitus ei siis ole se, ettei Ylen datasta tehtyä mashuppia saisi esittää esim. kaikille avoimella web-sivulla, jolla on mainoksia.

Jos lisenssi on jonkun mielestä liian tiukka, niin kertokaa, muutetaan sitten.

Kari

Lähettänyt käyttäjä

Ah, Tarmo ehtikin jo väliin. Hyvä pointti tuo tulosten vapaus. Mutta NC-SA taitaa sulkea paljon interaktiivista käyttöä pois?

Esim. Hesari ei saa tehdä sivuilleen interaktiivista verkkosovellusta, jossa vertaillaan lennossa YLEn ja Hesarin vaalikonedataa?

Lähettänyt käyttäjä

Hienoa. Mutta mitä NC ja SA käytännössä tarkoittavat tässä yhteydessä. Mitä tarkoittaa kaupallinen/epäkaupallinen käyttö ja mitä SA käytännössä tarkoittaa jos joku tekee mashuppeja?

Creative Commonsin sivut ovat aika epämääräisiä näiden suhteen.

Lähettänyt käyttäjä

Hei,

käytän dataa pro gradu -työssäni. Huomasin, että edustaja Lea Mäkipään vastaukset ovat tuolla kahteen kertaan (rivit 1051 ja 1052), eivätkä rivit ole aivan identtisiä. Kumpikohan riveistä on "oikea" eli se, johon kansalaisten vastauksia on verrattu?