Hakukone

Wikipediasta
Siirry navigaatioon Siirry hakuun

Hakukone on web-pohjainen sovellus, jonka avulla käyttäjä voi hakea verkkosivuja. Hakukoneeseen liittyy hakurobotti, joka etsii jatkuvasti Internetistä (varsinkin Webistä) uusia sivuja eritellen ja liittäen ne hakemistoonsa erityisten hakusanojen mukaan. Hakukonepalvelu on tyypillisesti käyttäjälle näkyvä verkkosivu, jonka avulla käyttäjä voi antaa hakusanoja etsiä lähimpänä olevia sivuja, mutta palvelua voi usein käyttää myös mobiilisovelluksen kautta.

Hakurobotin tekemä indeksointi ja käyttäjälle suositeltujen sivujen päättely (suosittelujärjestelmä) tapahtuvat erilaisilla menetelmillä eri hakukoneissa.

Vielä 1990-luvun alkupuolella hakukoneita ei tarvittu, sillä internetissä oli vain vähän sisältöä. Tietolähteiden linkkejä kerättiin portaaleihin eli linkkikirjastoihin, joista tunnetuin oli Yahoo.[1]

Hakukonelista

[muokkaa | muokkaa wikitekstiä]
Pääartikkeli: Luettelo hakukoneista
Internetin hakukoneita[2]
Hakukone Aiemmat nimet Toiminnan aloitusvuosi
Infoseek 1994
Lycos 1994
Netscape 1994
Yahoo 1994
WebCrawler 1994
AltaVista 1995
Excite Architext 1995
Inktomi 1995
Yandex 1997
Google 1997
Ask.com Ask Jeeves 1997
Overture 1998
Windows Live MSN Search 1998
AllTheWeb 1999
Bing[3] Windows Live Search, MSN Search 2009

1990-luvun alun jälkeinen kehitys

[muokkaa | muokkaa wikitekstiä]

Internetin kasvaessa linkkikirjastot eivät enää riittäneet sisällön hallitsemiseen. Keksittiin hakukoneet, jotka antoivat hakutuloksina listan sivuille, joilla haetut sanat esiintyivät. 1990-luvun tehokkain ja suosituin hakukone oli AltaVista. Se osasi myös karsia osumia, jotka osuivat samalle sivustolle. Tällainen yksinkertainen haku palautti hakutuloksinaan kuitenkin sellaisiakin sivuja, joille mainostajat ja pornon levittäjät olivat vain lisäilleet sanoja näkyäkseen suosituilla sanoilla tehdyissä hauissa.[1]

Kun Internet jatkoi kasvuaan, hakutulosten määrä kasvoi, ja hakukoneiden täytyi opetella erottamaan parhaat osumat huonoista. Google syntyi 1998 ja nousi suosituimmaksi hakukoneeksi.milloin? Sen peruskäyttöliittymä oli kilpailijoita kevyempi ja yksinkertaisempi. Se myös mittasi sivujen merkittävyyttä sen perusteella, mitä enemmän sivuun on linkattu muilta osumasivuilta. Tällaiset sivut se nosti hakutulostensa kärkeen.[1]

Toiminta nykyisin

[muokkaa | muokkaa wikitekstiä]

Nykyisin muutkin kehittyneet hakukoneet kuin Google painottavat hakutuloksia järjestäessään merkittävästi kohteisiin viittaavien linkkien määrää ja laatua. Googlen keskeisimmät kilpailijat hakutulosten laadussa ovat Microsoftin Bing ja Ask.com. Nämä kolme ovat myös suosituimmat hakukoneet länsimaissa. Microsoftin markkinaosuutta kasvattaa merkittävästi, että myös Yahoo! käyttää Bingin hakumoottoria.

Hakukoneissa on nykyisin erikoishakuja sekä haun rajaus- ja muotoilumahdollisuuksia. Esimerkiksi suomenkielisessä Googlessa on tavallisen sivuhaun lisäksi kuvahaku, karttahaku, YouTube-haku, tieteellisten artikkelien scholar-haku, uutishaku sekä blogihaku. Lisäksi siinä on tarkennettu haku -toiminto, jossa hakua voi muotoilla ja rajata monin tavoin.[4]

Hakukoneet voidaan jakaa yleisiin hakukoneisiin, metahakukoneisiin ja aihehakemistoihin. Yleiset hakukoneet perustuvat tietokantoihin. Ne ovat ohjelmia, jotka etsivät verkosta jatkuvasti uusia sivuja, analysoivat ne ja liittävät ne hakemistoonsa. Tällaisia ovat esimerkiksi Google, AltaVista, AllTheWeb ja HotBot. Metahakukoneet lähettävät haun monelle hakukoneelle samanaikaisesti ja keräävät niiden vastauksista linkkilistan. Metahakukoneet antavat paljon tuloksia, mutta ne voivat olla epätarkkoja. Metahakukoneita ovat esimerkiksi MetaCrawler ja WebCrawler. Aihehakemistot hakevat omista tietokannoistaan ja esittävät hakutulokset eräänlaisena indeksoituna linkkikirjastona, jossa linkit on luokiteltu. Ne antavat usein suppean hakutuloksen, mutta niiden tulokset voivat olla osuvampia kuin muiden hakukoneiden. Aihehakemistoja ovat esimerkiksi Yahoo ja WWW Virtual Library.[5]

Suomessa melko tunnettu hakemisto on ollut esimerkiksi Makupalat, joka on laaja Hämeenlinnan kaupunginkirjaston ylläpitämä suomenkielinen linkkikokoelma eli -hakemisto. Nykyään se on yhdistetty Kirjastot.fi-sivuston Linkkikirjasto-palveluun.

Paraskaan hakukone ei löydä kaikkia Web-sivuja. Rajoittavana tekijänä on esimerkiksi sivujen nopea muuttuminen. Hakukoneiden tietokannat eivät ole koskaan ajan tasalla, vaan ne käytännössä tarjoavat aina hieman vanhentuneita hakutuloksia. Tämän takia esimerkiksi tuoreimpien uutisten hakuun hakukoneet eivät sovellu,lähde? vaan tällöin kannattaa käyttää jonkin uutispalvelun omaa sisäistä hakua – tai esimerkiksi uutisten hakemiseen erikoistuneita hakukoneita (esimerkiksi Google News). Lisäksi merkittävä osa Internetistä tulee todennäköisesti olemaan jatkossakin hakukoneiden ulottumattomissa.lähde? Toisaalta kuka tahansa www-sivuston omistaja voi rajoittaa tai kokonaan estää hakukoneiden hakurobottien pääsyn sivustonsa sisältöön esimerkiksi robots.txt-tiedostolla.

Hakukoneoptimointi

[muokkaa | muokkaa wikitekstiä]
Pääartikkeli: Hakukoneoptimointi

Hakukoneoptimointi tarkoittaa keinoja, joilla verkkosivu pyritään nostamaan korkeammalle hakukoneiden hakutuloksissa, tai sen hakutulosten klikkaaminen tehdään houkuttelevammaksi. Hakukoneoptimoinnissa kiinnitetään huomiota esimerkiksi oikeiden avainsanojen käyttämiseen sivun nimessä, otsikoissa ja leipätekstissä sekä sivustolle johtavien linkkien määrään ja laatuun. Samalla pyritään välttämään sivuston piirteitä, joista hakukoneet rankaisevat sivua pudottamalla sitä hakutuloksissa alemmas.[6]

Saksalaisen tutkimuksen mukaan hakukoneiden tuloksien laatu heikkeni vuoden tarkastelujaksolla. Heikkolaatuisen materiaalin vyöry hukuttaa hyödylliset tulokset hakutuloksissa. Suuri osa huonolaatuisista tuloksista on tuotettu tekoälyn avulla tai kokonaan tekoälyllä.[7][8]

  1. a b c Annikka Mutanen: Hakukone - hyvän & pahan tiedon puu 11.3.2014. Tiede-lehti. Viitattu 21.5.2015.
  2. http://www.thehistoryofseo.com/The-Industry/Short_History_of_Early_Search_Engines.aspx (Arkistoitu – Internet Archive)
  3. The History of Web Search Engines: Bing Who is hosting this. Arkistoitu 6.5.2015. Viitattu 31.5.2015.
  4. Google – tehokäyttäjän työkalupakki 13.4.2015. Kirjastot.fi. Viitattu 21.5.2015.
  5. Hakukoneet ja aihehakemistot Kielikompassi. Jyväskylän yliopisto. Viitattu 21.5.2015.
  6. Arttu Raittila: Hakukoneoptimointi lyhyesti 26.2.2015. Nettibisnes.Info. Viitattu 21.5.2015.
  7. Jason Koebler: Google Search Really Has Gotten Worse, Researchers Find 404media.co. 16.1.2024. Viitattu 17.1.2024. (englanniksi)
  8. Janek Bevendorff, Matti Wiegmann, Martin Potthast, Benno Stein: Is Google Getting Worse? A Longitudinal Investigation of SEO Spam in Search Engines (PDF) downloads.webis.de. Viitattu 17.1.2024. (englanniksi)

Aiheesta muualla

[muokkaa | muokkaa wikitekstiä]