Transkribus

Wikipediasta
Siirry navigaatioon Siirry hakuun
Transkribus tunnistamassa kaunokirjoituksella kirjoitettua ranskankielistä avioehtosopimusta, joka muunnetaan selkeäksi tietokoneelle luettavaksi tekstiksi.

Transkribus on historiallisten asiakirjojen tekstintunnistuksen, kuva-analyysin ja rakenteiden tunnistamisen alusta.[1]

Alusta syntyi kahden EU-projektin tranScriptorium (2013–2015) ja READ (Recognition and Enrichment of Archival Documents – 2016–2019) yhteydessä[2][3][4]. Sen on kehittänyt Innsbruckin yliopisto. Heinäkuusta 2019 alkaen alustaa on ohjannut ja kehittänyt edelleen eurooppaosuuskunta Read-Coop[5]. Suomessa Kansallisarkisto on osuuskunnan jäsen[6][7].

Alustaan on integroitu eri puolilla Eurooppaa toimivien tutkimusryhmien, kuten Valencian teknillisen yliopiston Pattern Recognition and Human Language Technology (PRHLT) -ryhmän ja Rostockin yliopiston Computational Intelligence Technology Lab (CITlab) -ryhmän, kehittämiä työkaluja.[8]

Lähteet[muokkaa | muokkaa wikitekstiä]

  1. Välimäki, Mari: Muuttaako koneluenta käsinkirjoitettujen aineistojen tutkimusta? blogit.utu.fi. Viitattu 10.12.2022.
  2. tranScriptorium will turn HTR into a mature technology transcriptorium.eu. 4.6.2015. Viitattu 10.12.2022. (englanniksi)
  3. tranScriptorium Projektisivu cordis.europa.eu. Viitattu 10.12.2022. (englanniksi)
  4. Recognition and Enrichment of Archival Documents CORDIS. cordis.europa.eu. Viitattu 10.12.2022. (englanniksi)
  5. Read-Coop Read-Coop SCE. Viitattu 10.12.2022. (englanniksi)
  6. Haukkovaara, Vili: Kansallisarkisto mukana kehittämässä käsinkirjoitetun tekstin tunnistusta Näkökulmia arkistosta. 2016. Kansallisarkisto. Viitattu 10.12.2022.
  7. Members of Read-Coop SCE Read-Coop. Viitattu 10.12.2022. (englanniksi)
  8. Deslandres, Dominique: Conférence: Une révolution dans la reconstitution du passé (Konferenssi: Vallankumous menneisyyden rekonstruoinnissa). Fédération québécoise des sociétés de généalogie (Quebecin sukututkimusseurojen liitto), 23.9.2021. (ranskaksi)

Aiheesta muualla[muokkaa | muokkaa wikitekstiä]