Apertium

Kohteesta Wikipedia
Loikkaa: valikkoon, hakuun
Apertium
Apertium logo.svg
Kuvakaappaus Apertiumista
Kuvakaappaus Apertiumista
Kehityshistoria
Vakaa versio 3.4.2[1] / 15. toukokuuta 2016
Tiedot
Ohjelmistotyyppi Konekäännös
Käyttökielet Useita
Alusta POSIX-yhteensopiva
Ohjelmointikielet C++
Lisenssi GPL
Verkkosivu apertium.org

Apertium on sääntöihin perustuva konekäännösalusta. Se on vapaa ohjelmisto, joka on julkaistu GPL-lisenssin alla.

Historia[muokkaa | muokkaa wikitekstiä]

Apertium sai alkunsa yhtenä konekäännösmoottoreista OpenTrad-projektiin, joka on Espanjan hallituksen rahoittama. Se oli alun perin suunniteltu kääntämään sukulaiskieliä, vaikka sitä on viime aikoina laajennettu käsittelemään enemmän poikkeavia kielipareja. Uusi Apertium-konekäännösjärjestelmä kehitetään tekemällä kielellisiä materiaaleja (sanakirjoja, sääntöjä) hyvin määritellyssä XML-tiedostomuodossa.

Apertiumille kehitetyt kielimateriaalit tukevat tällä hetkellä asturian kieltä, baskia, bretonia, bulgariaa, katalaania, tanskaa, englantia, esperantoa, ranskaa, galegoa, islantia, makedoniaa, norjaa (bokmål ja nynorsk), oksitaania, portugalia, romaniaa, espanjaa, ruotsia ja kymriä. Koko lista on saatavilla alempana. Useat organisaatiot ovat myös osallistuneet Apertiumin kehitykseen, mukaan lukien Prompsit Language Engineering, Imaxin Software ja Eleka Ingeniaritza Linguistikoa.

Apertium on pinnalliseen transfer-teknologiaan perustuva konekäännösohjelma, joka käyttää äärellisiä automaatteja leksikaalisissa käännöksissä, ja Markovin piilomalleja sanaluokkamerkinnöissä. Tiettyjen kieliparien kesken käytetään myös rajoitekielioppi-analyysiohjelmia, kuten esim. bretoni-ranskan kesken.

Apertium-projekti on ollut osana Google Summer of Codea vuosina 2009 ja 2010. Vuonna 2010 se osallistui Google Code-in -tapahtumaan.[2]

Kieliparit[muokkaa | muokkaa wikitekstiä]

Lista vakaista kielistä.

ast eu br bg ca da en eo fr gl is mk nb nn oc pt ro es sv cy
asturia (⇄)
baski (→)
bretoni (→)
bulgaria (⇄)
katalaani (⇄) (←) (⇄) (⇄) (⇄) (⇄)
tanska (←)
englanti (⇄) (⇄) (⇄) (←) (←) (⇄) (←)
esperanto (←) (⇄) (←)
ranska (←) (⇄) (⇄)
galego (⇄) (⇄) (⇄)
islanti (→)
makedonia (⇄) (→)
norjan bokmål (⇄)
norjan nynorsk (⇄)
oksitaani (⇄) (⇄)
portugali (⇄) (⇄) (⇄)
romania (←)
espanja (⇄) (←) (⇄) (⇄) (⇄) (⇄) (⇄) (⇄) (←)
ruotsi (→)
kymri (→)

Lähteet[muokkaa | muokkaa wikitekstiä]

  • Corbí-Bellot, M. et al. (2005) "An open-source shallow-transfer machine translation engine for the romance languages of Spain" Proceedings of the European Association for Machine Translation, 10th Annual Conference, Budapest 2005:ssa, sivut 79–86
  • Armentano-Oller, C. et al. (2006) "Open-source Portuguese-Spanish machine translation" Lecture Notes in Computer Science 3960 [Computational Processing of the Portuguese Language, Proceedings of the 7th International Workshop on Computational Processing of Written and Spoken Portuguese, PROPOR 2006]:ssa, sivut 50-59.

Aiheesta muualla[muokkaa | muokkaa wikitekstiä]