Apertium
Apertium on sääntöihin perustuva konekäännösalusta. Se on vapaa ohjelmisto joka on julkaistu GNU-lisenssin alla.
Sisällysluettelo |
Historia [muokkaa]
Apertium sai alkunsa yhtenä konekäännösmoottoreista OpenTrad projektiin, joka on Espanjan hallituksen rahoittama. Se oli alunperin suunniteltu kääntämään sukua olevia kieliä, vaikka sitä on viime aikoina sitä on laajennettu käsittelemään enemmän poikkeavia kielipareja. Täytyy kehitellä kielellistä materiaalia (sanakirjoja, sääntöjä) hyvin määritellyssä XML tiedostomuodoissa, että voidaan aikaansaada uusi konekäännösjärjestelmä.
Sille kehitetyt kielimateriaalit tukevat tällä hetkellä Asturian kieltä, baskia, bretonia, bulgariaa, katalaania, tanskaa, englantia, esperantoa, ranskaa, galegoa, islantia, makedoniaa, norjaa (bokmål ja nynorsk), oksitaania, portugalia, romaniaa, espanjaa, ruotsia ja Walesin kieliä (kymri). Koko lista on saatavilla alempana. Useat yhdistykset ovat myös osallistuneet Apertiumin kehitykseen, mukaan lukien Prompsit Language Engineering, Imaxin Software ja Eleka Ingeniaritza Linguistikoa.
Apertium on pinnalliseen transfer-teknologiaan perustuva konekäännösohjelma, joka käyttää äärellisiä automaateja leksikaalisissa käännöksissä, ja Markovin piilomalleja sanaluokkamerkinnöissä. Tiettyjen kieliparien kesken käytetään myös rajoitekielioppianalyysiohjelmia, kuten esim. bretoni-ranskan kesken.
Apertium projekti on ollut osana Google Summer of Codea vuosina 2009 ja 2010. Vuonna 2010 se osallistui Google Code-in tapahtumaan.[1]
Kieliparit [muokkaa]
Lista vakaista kielistä.
ast |
eu |
br |
bg |
ca |
da |
en |
eo |
fr |
gl |
is |
mk |
nb |
nn |
oc |
pt |
ro |
es |
sv |
cy |
|
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| asturia | — | (⇄) | ||||||||||||||||||
| baski | — | (→) | ||||||||||||||||||
| bretoni | — | (→) | ||||||||||||||||||
| bulgaria | — | (⇄) | ||||||||||||||||||
| katalaani | — | (⇄) | (←) | (⇄) | (⇄) | (⇄) | (⇄) | |||||||||||||
| tanska | — | (←) | ||||||||||||||||||
| englanti | (⇄) | — | (⇄) | (⇄) | (←) | (←) | (⇄) | (←) | ||||||||||||
| esperanto | (←) | (⇄) | — | (←) | ||||||||||||||||
| ranska | (←) | (⇄) | — | (⇄) | ||||||||||||||||
| galego | (⇄) | — | (⇄) | (⇄) | ||||||||||||||||
| islanti | (→) | — | ||||||||||||||||||
| makedonia | (⇄) | (→) | — | |||||||||||||||||
| norjan bokmål | — | (⇄) | ||||||||||||||||||
| norjan nynorsk | (⇄) | — | ||||||||||||||||||
| oksitaani | (⇄) | — | (⇄) | |||||||||||||||||
| portugali | (⇄) | (⇄) | — | (⇄) | ||||||||||||||||
| romania | — | (←) | ||||||||||||||||||
| espanja | (⇄) | (←) | (⇄) | (⇄) | (⇄) | (⇄) | (⇄) | (⇄) | (←) | — | ||||||||||
| ruotsi | (→) | — | ||||||||||||||||||
| kymri | (→) | — |
Lähteet [muokkaa]
- Corbí-Bellot, M. et al. (2005) "An open-source shallow-transfer machine translation engine for the romance languages of Spain" Proceedings of the European Association for Machine Translation, 10th Annual Conference, Budapest 2005:ssa, sivut 79–86
- Armentano-Oller, C. et al. (2006) "Open-source Portuguese-Spanish machine translation" Lecture Notes in Computer Science 3960 [Computational Processing of the Portuguese Language, Proceedings of the 7th International Workshop on Computational Processing of Written and Spoken Portuguese, PROPOR 2006]:ssa, sivut 50-59.
Sivulta puuttuu