Hakukone

Wikipedia
Loikkaa: valikkoon, hakuun

Hakukone on internet-pohjainen ohjelma, joka etsii jatkuvasti internetistä uusia sivuja eritellen ja liittäen ne hakemistoonsa erityisten hakusanojen mukaan. Näitä hyväksi käyttäen hakukone tulostaa ruudulle käyttäjän syöttämiä hakusanoja lähimpänä olevat sivut. Analysointi tapahtuu käytännössä eri hakukoneissa erilaisilla menetelmillä.

Hakukoneiden historiaa[muokkaa | muokkaa wikitekstiä]

Infoseek oli ensimmäinen tunnettu Internet-hakukone. Se löytyi Netscape-selaimesta "Net search" -painikkeen takaa. Sen jälkeen tunnetuimmaksi hakukoneeksi nousi Digitalin Altavista. Nykyään Google on ollut jo usean vuoden ajan suosituin hakukone.

Googlen suosioon vaikutti se, että se tarjosi Altavistaa paremmin olennaisia hakutuloksia ja sen etusivu oli yksinkertainen, eikä siinä ollut aluksi lainkaan mainoksia. Ennen Googlea hakukoneiden etusivut muistuttivat portaaleja. Niillä oli uutisia ja mainoksia ja sivu latautui hitaasti tuon ajan yhteyksillä. Hakukoneet myös kilpailivat toistensa kanssa löydettyjen sivujen määrässä, siten että "paras" oli se haku, jolla löytyi eniten tuloksia. Tämän vuoksi oletusasetuksena oli listata kaikki sivut, joilta löytyi mikä tahansa annettu hakutermi. Esimerkiksi haku "Helsinki ravintola" löysi sivut, joilla oli sana 'Helsinki' tai sana 'ravintola'.

Nykyisin hakukoneet pyrkivät löytämään oleellisimmat sivut kaikkien sivujen joukosta. Kehittyneet hakukoneet painottavat hakutuloksia järjestäessään merkittävästi kohteisiin viittaavien linkkien määrää ja laatua. Googlen keskeisimmät kilpailijat hakutulosten laadussa ovat Microsoftin Bing (aiemmin Live Search) ja Ask.com. Nämä kolme ovat myös suosituimmat hakukoneet länsimaissa. Microsoftin markkinaosuutta kasvattaa merkittävästi, että myös Yahoo! käyttää Bingin hakumoottoria.

Pelkän tekstihaun lisäksi hakukoneissa on nykyisin kuvien haku. Google tarjoaa myös haun Usenet-uutisryhmistä aina keskusteluryhmien perustamisesta lähtien Dejanewsiltä ostamallaan aineistolla. Usenet-hakuja on useampikin, mutta ne ovat keskittyneet lähinnä uutisryhmien binääritiedostojen hakuun. Ajoittain on haettu muutakin Internetin aineistoa. Lycosilla oli Lycos FTP Search ja Lycos MP3 Search, jotka löysivät FTP-palvelimille tallennettuja tiedostoja ja mp3-musiikkia.

Taipuvien kielten käsittely[muokkaa | muokkaa wikitekstiä]

Aiemmin tyypillinen hakukoneiden ongelma oli, että ne eivät osanneet taivuttaa eri sanojen muotoja muilla kielillä. Nykyään Google tunnistaa useimpien suomenkielisten sanojen taivutusmuodot. Ominaisuus löytyy myös Webinfosta.

Hakukoneet vs. hakemistot[muokkaa | muokkaa wikitekstiä]

Ennen tehtiin ero sanahakukoneiden (etsii sanayhdistelmillä koko Internetistä) ja aihehakemistojen (käsin valikoituja aiheenmukaisesti luokiteltuja linkkejä) välillä, mutta nykyään sanahakukoneissakin on yleensä oma aihehakemisto. Toisaalta hakukoneet käyttävät hyväkseen myös aihehakemistojen tietoja, kuten esimerkiksi Open Directory Project -hakemistoa. Hakemistot ja sanahakukoneet täydentävätkin toisiaan erilaisina tapoina hakea tietoa.

Erikoistuneet hakukoneet ja hakupalvelut[muokkaa | muokkaa wikitekstiä]

Erilaisia tiettyyn aihealueeseen erikoistuneita hakukoneita ja -palveluita on maailmalla tuhansia. Suomalaisista hakupalveluista melko tunnettu hakemisto on esimerkiksi Makupalat, joka on laaja Hämeenlinnan kaupunginkirjaston ylläpitämä suomenkielinen aiheenmukainen linkkikokoelma eli aihehakemisto.

Kysy kirjastonhoitajalta -palvelu poikkeaa useista muista palveluista haun toteutustavan perusteella. Palvelun kautta kysyttyihin kysymyksiin kirjastonhoitaja etsii vastauksen. Ihmisen tietämyksen käyttäminen tiedonhaussa antaa mahdollisuuden hakukoneille vaikeiden kysymysten esittämiseen.

Hakukoneiden kattavuus[muokkaa | muokkaa wikitekstiä]

Paraskaan hakukone ei kuitenkaan löydä kaikkia www-sivuja. Rajoittavana tekijänä on esimerkiksi www-sivujen nopea muuttuminen. Hakukoneiden tietokannat eivät ole koskaan ajan tasalla, vaan ne käytännössä tarjoavat aina hieman vanhentuneita hakutuloksia. Tämän takia esimerkiksi tuoreimpien uutisten hakuun hakukoneet eivät sovellu, vaan tällöin kannattaa käyttää jonkin uutispalvelun omaa sisäistä hakua – tai esimerkiksi uutisten hakemiseen erikoistuneita hakukoneita (esimerkiksi Google News). Lisäksi merkittävä osa Internetistä tulee todennäköisesti olemaan jatkossakin hakukoneiden ulottumattomissa (ns. "Pimeä Internet"). Toisaalta kuka tahansa www-sivuston omistaja voi rajoittaa tai kokonaan estää hakukoneiden hakurobottien pääsyn sivustonsa sisältöön.

Hakukoneita[muokkaa | muokkaa wikitekstiä]

Pääartikkeli: Luettelo hakukoneista

Hakemistoja[muokkaa | muokkaa wikitekstiä]

  • Suomenyritykset - Hakemisto suomalaisten yritysten yhteystiedoista ja palveluista.

Katso myös[muokkaa | muokkaa wikitekstiä]

Aiheesta muualla[muokkaa | muokkaa wikitekstiä]