yle.fi-etusivu

Mitä tapahtuu, kun googlaat? Lue tämä ja seitsemän muuta tietoa hakukoneista

Ihmiskunta tekee satoja miljoonia googlehakuja päivässä. Kuinka ihmeessä kone pyydystää haluamasi tiedon verkon syövereistä?

talous

1

Hakukone 1

Tunteeko hakukone netin kokonaan?

Ei tunne. Esimerkiksi Google on koonnut oman hakemistonsa netin sisällöstä ja kartoitus jatkuu.

Hakemiston kerryttämiseksi Google käyttää ryömijöiksi kutsuttuja tietokoneohjelmia. Ne hakeutuvat hakukoneen keskeisimpinä pitämille nettisivuille ja jatkavat matkaa sivuille, joihin edellisistä on linkattu. Käydyt sivut tallentuvat osaksi hakemistoa.

Ryömijät [crawler] jatkavat eteenpäin tallentaen tiedon seuraavistakin sivuista, joihin linkit vievät. Näin kertyy luettelo varsin suuresta osasta netin sisältöä.

Googlen kokoama hakemisto [indeksi] sisältää miljardeja sivuja ja se täydentyy koko ajan.

Sinun hakutuloksesi kone etsii tuosta hakemistosta. Samankaltaista indeksiä kokoavat muutkin suositut hakukoneet.

2

Hakukone 2

Miten Google osaa etsiä pelkän hakusanan perusteella?

Kun syötät hakusanan, Googlelle se ei ole pelkkä sana vaan nippu vihjeitä. Hakukone tunnistaa mahdolliset kirjoitusvirheesi ja ohittaa ne. Se myös täydentää vajavaisesti kirjoitetut sanat.

Hakukone etsii hakemistostaan kaikki ne sivut, joissa sanasi esiintyy, ja se kiinnittää erityistä huomiota sivuihin, joihin on linkattu paljon muualta. Ohjelmisto tunnistaa lähteistä myös hakusanasi synonyymit. Se siis laajentaa kuvaa siitä, mitä tarkalleen ottaen etsit.

Hakusanassa käyttämälläsi kielelläkin on merkitystä. Lisäksi hakukone tunnistaa fraasit ja erisnimet ja luo automaattisesti yhteyksiä samankaltaisiin sanoihin.

Vihjeitä yhdistelemällä Google poimii hakemistostaan esiin merkitykselliset sivut ja suodattaa ne hakutuloksiksi.

3

Hakukone 3

Miten hakutulosten paremmuusjärjestys syntyy?

Kun saat hakuosumat ruudullesi, puolessa sekunnissa enterin painamisesta, osumien järjestys on tarkan suodattamisen tulos.

Google kysyy löytämiltään osumilta yli 200 kysymystä. Montako kertaa hakusana esiintyy tällä sivulla? Sisältyykö sana otsikkoon tai sivun osoitteeseen? Onko sivun takana luotettava taho vai onko kyseessä epämääräinen keskustelupalsta tai jopa roskaposti?

Kuinka syvällä sivujen rakenteessa osuma sijaitsee? Onko sivulla kuvia? Kuinka usein muut käyttäjät ovat valinneet sivun nähtäväkseen samaa asiaa hakiessaan?

Lisäksi mekaaninen laskujärjestelmä arvioi, kuinka moni muualla netissä oleva linkki johdattaa hakuehdot täyttävälle sivulle, ja kuinka tärkeitä nuo linkit ovat.

Eri suodattamistapoja yhdistämällä syntyy järjestys, jossa hakutulokset eteesi saat.

4

Hakukone 4

Kuinka hakutuloksiin vaikuttaa se, missä olen?

Hakukone päättelee jo ip-osoitteen perusteella sijaintisi. Näin esimerkiksi hakusanalla "ravintola" saat väistämättä tuloksia lähelläsi olevista ruokapaikoista.

Mikäli hakukoneella on hallussaan sinusta kertyneitä käyttäjätietoja, kuten kotiosoite tai maininta työpaikastasi, sitä paikallisempia hakutuloksia saat.

Sijaintiakin keskeisemmäksi voivat nousta muut henkilökohtaiset tiedot käyttäjästä.

Jos haet tietoa kaukaisesta maasta ja kaverisi tekee täysin saman haun omalla koneellaan, toinen voi saada tulokseksi tietoja maan ihmisoikeustilanteesta ja toinen vinkkejä matkailuun.

5

Hakukone 5

Paljonko tulosten osuvuus vaihtelee hakukoneittain?

Suuret hakukoneet, kuten Google, Bing, Baidu ja Yandex ovat periaatteiltaan ja arkkitehtuuriltaan hyvin samankaltaisia. Kaikki rakentavat sisällysluetteloa webin sisällöstä ja tarjoavat hakutulokset käyttäjälleen monin kriteerein suodatettuna.

Hakutulosten erot johtuvat palveluiden vaihtelevasta kyvystä personoida vastauksia. Jos olet palvelun aktiivikäyttäjä, aikaisempi hakuhistoriasi auttaa konetta osuvampiin tuloksiin. Mikäli käytät esimerkiksi Google Docs -palvelua ja omistat Gmail-tilin, yrityksen on helpompi päätellä, mistä olet kiinnostunut. Samat taustatiedot vaikuttavat myös ruudullesi työntyviin mainoksiin.

Toinen ero hakukoneiden osuvuudessa tulee hakemiston laajuudesta: mitä laajempaa sisällysluetteloa yritys rakentaa hakujensa lähteeksi ja mitä useammin sillä on varaa tuoreuttaa tietoaineistojaan, sitä paremmin hakukone vakuuttaa käyttäjänsä.

6

Hakukone 6

Miten datakeskus Suomessa vaikuttaa suomalaisen nettihakuihin?

Datakeskus Suomessa mahdollistaa kyselyn käsittelemisen paikallisesti. Jos googlehaun tieto kulkeutuu Kuopiosta Haminaan, se taittaa lyhyemmän matkan, matka taittuu nopeammin ja voi kuluttaa vähemmän energiaa. Tuolloin reitti on myös luotettavampi kuin merikaapeleiden tai ulkomailla sijaitsevien solmukohtien kautta.

Hakukoneyhtiöt eivät kuitenkaan kerro tietoliikenteensä reittejä. Tiedetään, että esimerkiksi Google on hajauttanut varastoimansa tiedon eri puolille maailmaa ainakin 13 datakeskukseen: sama tieto on tallessa monessa paikassa.

Yrityksen ulkopuoliset asiantuntijat arvioivat, että hakukone voi osoittaa kyselyn myös yksinkertaisesti siihen keskukseen, jossa juuri sillä hetkellä on vapaata prosessointitilaa.

Haun eteneminen pitkin maapalloa riippuu myös siitä, millaista tietoa etsitään: EU on tiukentanut sääntöjään henkilötietojen säilömisestä Euroopan ulkopuolelle, mikä vaikuttaa esimerkiksi sosiaalisen median palveluiden käyttämiin tietovarastoihin. Näin paikallisten datakeskusten merkitys kasvaa.

7

Hakukone 7

Kuinka suuri tietovarasto on datakeskus?

Niin hakukoneet, pelifirmat, sosiaalinen media, sähköpostit kuin videosivustotkin sijoittavat palveluitaan pyörittävät tietokoneensa datakeskuksiin eli pilveen. Yksi datakeskus voi sisältää yli 100 000 palvelintietokonetta.

Ajattele tietomäärää kotikäyttöön myytävien ulkoisten kovalevyjen kautta. Sellaiselle voi tallentaa tiedostoja muutamia teratavuja.

Datakeskusten kohdalla päästään jo petatavuihin - yksi peta on tuhat teraa. Datakeskusten tarkat kapasiteetit ovat liikesalaisuuksia, mutta asiantuntijat arvioivat yhden datakeskuksen sisältävän jopa satoja petatavuja dataa.

8

Hakukone 8

Missä minun pilvipalveluun tallentamani tiedostot ovat fyysisesti?

Pilvipalvelun taustalla pyörivä älykäs ohjelmisto ripottelee pilveen siirretyt tiedot useisiin datakeskuksiin. Turvallisuussyistä yritykset eivät yleensä kerro aineistojen tarkkoja sijainteja.

Hajauttamisen ansiosta lomakuvasi ja sähköpostisi ovat turvassa. Vaikka yksittäinen datakeskus tai siellä sijaitseva palvelin vaurioituisi, globaali järjestelmä on tehnyt varmuuskopiot toiseen keskukseen.

Vaihtelevat lainsäädännöt ovat saaneet osan kuluttajista ja yrityksistä huolestumaan tiedostojensa sijainnista ja yksityisyydestä. Esimerkiksi tabletilla otetut kuvat ovat käytännössä vain pilvessä, itse laitteella sijaitsevat enää välimuistikopiot.

Yrityksiä pilvipalveluun siirtymisessä voi mietityttää maantieteellisen sijainnin vaikutus palvelun toimintaan. Niinpä vaikka Amazonilta pilvitilaa ostava voi valita, minkämaalaisen datakeskuksen pilveä käyttää. Arkaluontoisen tiedon, kuten patentoitavien ideoiden, tallentamista pilveen pitää harkita huolella.

Datakeskukset – Mitä ne ovat? (Yle)

Suomi vastaan Ruotsi – kumpi voittaa kilpailun datakeskuksista (Yle)

Näin suojaat yksityisyyttäsi netissä ilman erityistaitoja (Yle)

Näitä tietoja ihmiset haluavat poistaa Googlesta (Yle)

EU-tuomioistuin mitätöi tietosuojasopimuksen Yhdysvaltojen kanssa (Yle)

Suomalaiset luottavat yksityisyyden suojaamisessa vähiten Googleen ja Facebookiin (uta.fi) (siirryt toiseen palveluun)

How Search Works -infografiikka (Google) (siirryt toiseen palveluun)