Hakukone

Wikipedia
Loikkaa: valikkoon, hakuun

Hakukone (engl. Search engine) on Web-pohjainen ohjelma, joka etsii jatkuvasti Internetistä (varsinkin Webistä) uusia sivuja eritellen ja liittäen ne hakemistoonsa erityisten hakusanojen mukaan. Näitä hyväksi käyttäen hakukone tulostaa käyttäjän syöttämiä hakusanoja lähimpänä olevat sivut. Analysointi tapahtuu käytännössä eri hakukoneissa erilaisilla menetelmillä.

Hakukoneiden historiaa[muokkaa | muokkaa wikitekstiä]

Infoseek oli ensimmäinen tunnettu Internet-hakukone.lähde? Se löytyi Netscape-selaimesta "Net search" -painikkeen takaa.selvennä Sen jälkeen tunnetuimmaksi hakukoneeksi nousi Digitalin Altavista. Nykyään Google on ollut jo usean vuoden ajan suosituin hakukone.

Googlen suosioon vaikutti se, että se tarjosi Altavistaa paremmin olennaisia hakutuloksiakenen mukaan? ja sen etusivu oli yksinkertainen, eikä siinä ollut aluksi lainkaan mainoksia. Ennen Googlea hakukoneiden etusivut muistuttivat portaaleja. Niillä oli uutisia ja mainoksia ja sivu latautui hitaasti tuon ajan yhteyksillä. Hakukoneet myös kilpailivat toistensa kanssa löydettyjen sivujen määrässä, siten että ”paras” oli se haku, jolla löytyi eniten tuloksia.lähde? Tämän vuoksi oletusasetuksena oli listata kaikki sivut, joilta löytyi mikä tahansa annettu hakutermi. Esimerkiksi haku Helsinki ravintola löysi sivut, joilla oli sana Helsinki tai sana ravintola.

Nykyisin hakukoneet pyrkivät löytämään oleellisimmat sivut kaikkien sivujen joukosta. Kehittyneet hakukoneet painottavat hakutuloksia järjestäessään merkittävästi kohteisiin viittaavien linkkien määrää ja laatua. Googlen keskeisimmät kilpailijat hakutulosten laadussa ovat Microsoftin Bing (aiemmin Live Search) ja Ask.com. Nämä kolme ovat myös suosituimmat hakukoneet länsimaissa. Microsoftin markkinaosuutta kasvattaa merkittävästi, että myös Yahoo! käyttää Bingin hakumoottoria.

Pelkän tekstihaun lisäksi hakukoneissa on nykyisin kuvien haku. Google tarjoaa myös haun Usenet-uutisryhmistä aina keskusteluryhmien perustamisesta lähtien Dejanewsiltä ostamallaan aineistolla. Usenet-hakuja on useampikin, mutta ne ovat keskittyneet lähinnä uutisryhmien binääritiedostojen hakuun. Ajoittain on haettu muutakin Internetin aineistoa. Lycosilla oli Lycos FTP Search ja Lycos MP3 Search, jotka löysivät FTP-palvelimille tallennettuja tiedostoja ja mp3-musiikkia.lähde?

Hakukoneiden ongelmia[muokkaa | muokkaa wikitekstiä]

Aiemmin tyypillinen hakukoneiden ongelma oli, että ne eivät osanneet taivuttaa sanoja eri kielillä. Nykyään Google tunnistaa useimpien suomenkielisten sanojen taivutusmuodot. Ominaisuus löytyy myös Webinfosta.lähde?

Hakukoneet ja hakemistot[muokkaa | muokkaa wikitekstiä]

Ennen tehtiin ero hakukoneiden (etsii sanayhdistelmillä koko Internetistä) ja hakemistojen (käsin valikoituja aiheenmukaisesti luokiteltuja linkkejä) välillä, mutta nykyään hakukoneissakin on yleensä oma hakemisto.lähde? Toisaalta hakukoneet käyttävät hyväkseen myös hakemistojen tietoja, kuten esimerkiksi DMOZ -hakemistoa. Hakemistot ja hakukoneet täydentävätkin toisiaan erilaisina tapoina hakea tietoa.

Erilaisia tiettyyn aihealueeseen erikoistuneita hakukoneita ja hakemistoja on maailmalla tuhansia. Suomessa melko tunnettu hakemisto on ollut esimerkiksi Makupalat, joka on laaja Hämeenlinnan kaupunginkirjaston ylläpitämä suomenkielinen linkkikokoelma eli -hakemisto. Nykyään se on yhdistetty Kirjastot.fi-sivuston Linkkikirjasto-palveluun.

Kysy kirjastonhoitajalta -palvelu poikkeaa useista muista palveluista haun toteutustavan perusteella. Palvelun kautta kysyttyihin kysymyksiin kirjastonhoitaja etsii vastauksen. Ihmisen tietämyksen käyttäminen tiedonhaussa antaa mahdollisuuden hakukoneille vaikeiden kysymysten esittämiseen.selvennä

Hakukoneiden kattavuus[muokkaa | muokkaa wikitekstiä]

Paraskaan hakukone ei kuitenkaan löydä kaikkia Web-sivuja. Rajoittavana tekijänä on esimerkiksi sivujen nopea muuttuminen. Hakukoneiden tietokannat eivät ole koskaan ajan tasalla, vaan ne käytännössä tarjoavat aina hieman vanhentuneita hakutuloksia. Tämän takia esimerkiksi tuoreimpien uutisten hakuun hakukoneet eivät sovellu,lähde? vaan tällöin kannattaa käyttää jonkin uutispalvelun omaa sisäistä hakua – tai esimerkiksi uutisten hakemiseen erikoistuneita hakukoneita (esimerkiksi Google News). Lisäksi merkittävä osa Internetistä tulee todennäköisesti olemaan jatkossakin hakukoneiden ulottumattomissa.lähde? Toisaalta kuka tahansa www-sivuston omistaja voi rajoittaa tai kokonaan estää hakukoneiden hakurobottien pääsyn sivustonsa sisältöön esimerkiksi robots.txt-tiedostolla

Katso myös[muokkaa | muokkaa wikitekstiä]

Aiheesta muualla[muokkaa | muokkaa wikitekstiä]