Webometriikka

Wikipediasta
Siirry navigaatioon Siirry hakuun

Webometriikka on infometrisen tutkimuksen alue, joka tutkii World Wide Webissä olevien verkkosivustojen ja -sivujen, hyperlinkkien ja hakukoneiden tulosten määrää, laatua ja käyttötarkoituksia.[1] Painettuun julkaisuun kohdistuvaa tutkimusta kutsutaan bibliometriikaksi.[2]

Björnebornin ja Ingwersenin (2004) mukaan webometriikan määritelmä on ”verkossa olevan informaation lähteiden, konstruktioiden ja teknologioiden rakenteen ja käytön kvantitatiivisten aspektien tutkiminen infometrisestä ja bibliometrisestä lähestymistavasta.”[3] Mike Thelwall (2009) on kirjassaan sittemmin laajentanut käsitettä esittäen, että webometriikka on ”verkkopohjaisen sisällön tutkimusta pääasiassa kvantitatiivisin metodein yhteiskuntatieteellisen tutkimuksen tavoitteisiin käyttäen tekniikoita jotka eivät ole lajityypillisiä yhdelle tutkimusalueelle.” Tällä määritelmällä Thelwall pyrki vapauttamaan webometriikan informetriikan alaisuudesta kohti laajempaa yhteiskuntatieteellistä kuulijakuntaa.[1]

Webometriikan historia

[muokkaa | muokkaa wikitekstiä]

Webometrics- eli webometriikka-termi otettiin ensimmäisenä käyttöön Almindin ja Ingwersenin toimesta vuonna 1997. Sitä ennen webometriikkaa kuvaavaksi termiksi ehdotettiin käsitteitä netometrics (Bossy, 1995), webometry (Abraham, 1996), internetometrics (Almind & Ingwersen, 1996) ja cybermetrics (Aguillo, 1997).[3] Joissain maissa termi cybermetrics on korvannut webometriikka-termin. Cybermetrics on terminä laajempi ja käsittää myös esimerkiksi sähköpostien ja erilaisten internetissä olevien keskusteluryhmien tutkimuksen.[1]

Informetrisen tutkimuksen kohteet

[muokkaa | muokkaa wikitekstiä]

Webometrinen tutkimus, kuten kaikki muukin informetrinen tutkimus, on kvantitatiivista eli määrällistä tutkimusta. Informetrisessä tutkimuksessa mitattavia suureita ovat:

  1. Tuottajat: kirjoittajat, tutkimuslaitokset, valtiot jne.
  2. Julkaisut: artikkelit, kirjat, verkkosivut, blogit jne.
  3. Lähteet: julkaisujen lähdeluetteloissa mainitut teokset, viittaukset ja linkit
  4. Termit: julkaisun sisältöä kuvaavat sanat, kuten otsikossa esiintyvät käsitteet ja sisällönkuvailutermit. [2]

Webometrisiä analyysitekniikoita

[muokkaa | muokkaa wikitekstiä]

Webometrisiä analyysitekniikoita ovat linkkianalyysi, verkkoviittausten analyysi, blogianalyysi sekä hakukonearviointi.[4]

[muokkaa | muokkaa wikitekstiä]

Linkkianalyysissa tutkitaan verkkosivujen tai verkkosivustojen välisiä hyperlinkkejä. Useimmat webometrisistä tutkimuksista ovat linkkianalyyseja.[1]

Hyperlinkit ovat paitsi apuvälineitä verkkosivuilla navigoimiseen, ne sisältävät myös epäsuoraa tietoa, jota voidaan käyttää tutkimuksessa.[1] Näitä tietoja ovat muun muassa se, kuinka suosittu verkkosivusto on, mitkä sivut ovat suosituimpia sekä miksi tai missä sivusto on suosittu.[4]

Yleisesti ottaen parhaimmille ja hyödyllisimmille verkkosivuille kohdistuu eniten hyperlinkkejä. Tietylle verkkosivulle tai –sivustolle linkittyvien verkkosivujen määrää, eli erilaisten hyperlinkkien määrää, kutsutaan sivulle tai sivustolle tulevien linkkien määräksi. Tätä tietoa käytetään hyödyksi esimerkiksi Googlen PageRank-järjestelmässä.[1]

Sivulle tai sivustolle tulevien linkkien määrä ei kuitenkaan kerro kaikkea, koska monet linkit on tarkoitettu vain sivustolla navigointiin. Tällaiset linkit yleensä sivuutetaan webometrisissä linkkianalyyseissa. Lisäksi sama linkki joskus esiintyy verkkosivuston eri sivuilla moneen kertaan sivuston tekijän tietoisen valinnan seurauksena, mikä vääristää linkin merkityksellisyyttä. Tästä syystä webometrisissä laskelmissa lasketaan yleensä vain kahden verkkosivuston väliset linkit, ei kahden verkkosivun välisiä linkkejä.[1]

Linkit linkittävät usein saman aihepiirin verkkosivut yhteen, joten ne voivat kertoa millaiset sisällöt ja sivut ovat keskenään samankaltaisia. Aina ei kuitenkaan näin ole, vaan linkkianalyyseissa toisiinsa liittymättömät, mutta silti linkitetyt sivut muodostavat usein tuloksiin hälyä.[1]

Verkkoviittausten analyysi (engl. Web mention analysis)

[muokkaa | muokkaa wikitekstiä]

Verkkoviittausten analyysin tarkoituksena on selvittää, kuinka usein johonkin dokumenttiin tai käsitteeseen on viitattu verkossa. Perusideana on, että mitä useammin dokumenttiin tai käsitteeseen on viitattu, sitä merkityksellisempi se on.

Verkkoviittauskerroin (engl. Web impact factor) on tietylle sivustolle suuntautuvien linkkien ja sivustoon kuuluvien sivujen määrän suhde. Laskemiseen on useita erilaisia käytäntöjä. [2]

Blogianalyysi (engl. Blog analysis)

[muokkaa | muokkaa wikitekstiä]

Blogianalyysissa tutkitaan blogien sisältöä. Blogit ovat yhteiskuntatieteellisille tutkimuksille tärkeitä tiedonlähteitä niiden sisältämien mielipiteiden, vapaamuotoisuuden ja suuren määrän ansiosta. Blogipostaukset myös arkistoituvat verkkoon, mikä mahdollistaa myös menneiden asioiden tutkimisen.[1]

Yksinkertaisimpia tapoja tutkia blogeja on blogien etsimiseen tarkoitettujen hakukoneiden ja avainsanojen käyttäminen. Hyödyllistä blogeja tutkiessa on etsiä postauksia päivämäärän perusteella, mikä onkin mahdollista useissa hakukoneissa.[1]

Blogien aineisto ei usein ole kovinkaan todistusvoimaista, koska bloggaajat eivät edusta koko väestöä ja blogien sisältö ei aina ole sellaista, jota väestö pitää yleisesti tärkeänä.[1]

Hakukonearviointi (engl. Search engine evaluation)

[muokkaa | muokkaa wikitekstiä]

Kaupalliset hakukoneet ovat webometriikalle tärkeitä, koska ne tarjoavat paljon raakaa dataa tutkimuksille. Hakukoneiden antamien tulosten kattavuutta halutaan tutkia, koska Internetin käyttäjät käyttävät niitä tiedonhaussa paljon. Eri hakukoneiden palauttamat tulokset voivat vaihdella paljonkin. Erot voivat johtua esimerkiksi erilaisista sivustojen järjestelymenetelmistä tai hakurobottien kattavuusalueista.[1]

Webometrisessä tutkimuksessa hakukoneiden palauttamia eriäviä tuloksia voidaan hyödyntää kahdella tavalla. Ensimmäinen tapa on verrata keskenään hakukoneiden palauttamien tulosten tuottamia tilastoja. Tämä vertailu voi kertoa kuinka luotettavia hakukoneiden antamat luvut ovat. Toinen tapa on käyttää useita hakukoneita ja yhdistää ja yleistää niiden antamia tuloksia kunkin hakukoneen tuloksiin tuottamien ominaispiirteiden minimoimiseksi.[1]

Webometriikan haasteet

[muokkaa | muokkaa wikitekstiä]

Webometriikalla on toistaiseksi omat haasteensa tutkimuksen relevanttiuteen verrattuna bibliometriikkaan. Aineistoihin pääsee helpommin käsiksi verkossa, mutta haasteita luovat aineistot jotka eivät ole käyneet läpi tieteellistä julkaisuprosessia [2], tiedostojen rajoitukset ja datan validius. Toisaalta verkossa koko tieto on saavutettavissa ja muokattavissa jälkeenpäin tarpeen vaatiessa. [5]

  1. a b c d e f g h i j k l m Mike Thelwall (2009). Introduction to Webometrics: Quantitative Web Research for the Social Sciences. Morgan & Claypool. ISBN 978-1-59829-993-9.
  2. a b c d Terttu Kortelainen (2010). Tieteellinen julkaisutoiminta ja informetrinen tutkimus.
  3. a b Lennart Björneborn & Peter Ingwersen (2004). Toward a basic framework for webometrics. Journal of the American Society for Information Science and Technology. 55 (14): 1216–1227. doi:10.1002/asi.20077
  4. a b TIDSR: Toolkit for the Impact of Digitised Scholarly Resources, What is webometrics? http://microsites.oii.ox.ac.uk/tidsr/kb/23/what-webometrics (Arkistoitu – Internet Archive) Viitattu 17.2.2018.
  5. Tomas C. Almind & Peter Ingwersen (1997). Informetric analyses on the World Wide Web: Methodological approaches to 'webometrics'. Journal of Documentation. 53 (4): 404–426. doi:10.1108/EUM0000000007205