Ero sivun ”Heritrix” versioiden välillä

Wikipediasta
Siirry navigaatioon Siirry hakuun
[arvioimaton versio][arvioimaton versio]
Poistettu sisältö Lisätty sisältö
Ei muokkausyhteenvetoa
ChuispastonBot (keskustelu | muokkaukset)
p r2.7.1) (Botti lisäsi: ar:هيراتراكس
Rivi 21: Rivi 21:
[[Luokka:World Wide Web]]
[[Luokka:World Wide Web]]


[[ar:هيراتراكس]]
[[en:Heritrix]]
[[en:Heritrix]]
[[es:Heritrix]]
[[es:Heritrix]]

Versio 5. kesäkuuta 2011 kello 13.22

Heritrix on pääasiassa Internet Archiven kehittämä hakurobotti verkkoaineistojen keräämiseen. Kehitystyössä on mukana myös muita IIPC:n jäseniä eli pääasiassa kansalliskirjastoja. Hakurobotti on toteutettu Javalla ja sisältää laajan valikoiman asetuksia, joilla erilaisia keruutoimintoja voidaan toteuttaa. Keruurobottia on käytetty onnistuneesti useissa hyvin laajoissa verkkoaineistojen haravointiprojekteissa ja sen tekninen toteutus osaa kiertää monet yleisesti keräyksissä vastaantulevat tekniset ongelmat.

Heritrixiä käyttävät yleensä kansalliskirjastot tai muut toimijat, joiden tehtäviin kuuluu verkkoaineistojen kerääminen ja säilyttäminen jälkipolville. Heritrix:iä voidaan käyttää myös erilaisten vähemmän teknisten käyttöliittymien kautta kuten NetArchiveSuite tai Web Curator Tool.

Suomen Kansalliskirjasto kerää Suomea koskevia Internetin aineistoja kulttuuriaineistojen tallettamista ja säilyttämistä koskevan lain (28.12.2007/1433) mukaisesti. Myös muiden maiden kansalliskirjastojen toiminta perustuu samankaltaisiin lakeihin.

Katso myös

Aiheesta muualla