Oikeinkirjoituksen tarkistin

Wikipedia
Loikkaa: valikkoon, hakuun
Tekstinkäsittelyohjelman AbiWordin oikeinkirjoituksen tarkistin.

Tietotekniikassa oikeinkirjoituksen tarkistin (joka tunnetaan myös nimillä oikeinkirjoituksen tarkistus, korjausluku, oikaisuluku tai oikoluku) on tietokoneohjelma tai ohjelman toiminto, joka tarkistaa dokumentin sanojen oikeinkirjoituksen. Oikeinkirjoituksen tarkistin voi olla erillinen tekstejä käsittelevä sovellus. Yleensä tarkistin on kuitenkin osa laajempaa sovellusta, esimerkiksi tekstinkäsittelyohjelmaa tai sähköpostiohjelmaa.

Oikeinkirjoituksen tarkistin toimii vertaamalla kutakin syötesanaa sanastoon. Jos sanaa ei löydy sanastosta, tarkistin merkitsee sen virheelliseksi ja voi ehdottaa korjauksia. Yksinkertainen korjausehdotusalgoritmi voi etsiä sanastosta syötesanaa muistuttavia sanoja editointietäisyyden perusteella.

Oikeinkirjoituksen tarkistin voi toimia kirjoituksen aikana ja ilmoittaa käyttäjälle virheestä esimerkiksi alleviivaamalla virheellisen sanan. Se voi myös tarkistaa käyttäjän pyynnöstä kokonaisen dokumentin tai sähköpostiviestin. Tekstinkäsittelyohjelmat tarjoavat yleensä molemmat vaihtoehdot.

Oikeinkirjoituksen tarkistimen sanasto on väistämättä aina epätäydellinen varsinkin erisnimien ja lyhenteiden osalta. Useimmissa tarkistimissa käyttäjä voi lisätä uusia sanoja sanastoon. Joihinkin tarkistimiin on saatavana myös eri alojen erikoissanastoja.

Eri kielten asettamat erilaiset vaatimukset[muokkaa | muokkaa wikitekstiä]

Isoloivissa kielissä eli kielissä, joissa sanat eivät taivu sekä sellaisissa muissa kielissä (esimerkiksi englannin), joissa sanat taipuvat, mutta taivutus on hyvin yksinkertaista ja vähäistä, tarkistimen sanasto voi olla yksinkertaisimmillaan pelkkä sanalista, mutta agglutinoivissa kielissä kuten suomessa, oikeinkirjoituksen tarkistimen täytyy sisältää tietoa kielen morfologiasta. Suomen kielessä oikeinkirjoituksen tarkistimen täytyy tuntea esimerkiksi sija- ja persoonapäätteet sekä astevaihtelu. Yleispätevä sanaston toteutus voi perustua esimerkiksi äärellisiin automaatteihin.

Taivutustakin isompi haaste ovat yhdyssanat. Suomen kielen yhdyssananmuodostus on varsin vapaata, mutta kaikki yhdyssanat eivät ole semanttisesti järkeviä. Koska oikeinkirjoituksen tarkistimella ei ole yleensä tietoa semantiikasta, tarkistimen tekijä joutuu tasapainoilemaan vapaan ja rajoitetun yhdyssananmuodostuksen välillä. Liian vapaa toteutus voi hyväksyä ja ehdottaa outoja yhdyssanoja; liian rajoitettu toteutus puolestaan hylkää epätavalliset mutta kelvolliset yhdyssanat.

Kaupallisia suomen kielen oikeinkirjoituksen tarkistimia ovat kehittäneet muun muassa Lingsoft, Kielikone ja Lanser Data.[1] Ilmaisia tarkistimia ovat muun muassa Soikko ja Voikko.

Katso myös[muokkaa | muokkaa wikitekstiä]

Lähteet[muokkaa | muokkaa wikitekstiä]

  1. Antti Arppe: Ei yhtä ainoaa polkua – Suomalaisia kokemuksia matkalla kieliteknologisesta tutkimuksesta liiketoimintaan FiLT, Suomen kieliteknologian dokumentaatiokeskus. Viitattu 30.4.2007.