Yhdistyvä merkki

Wikipedia
Ohjattu sivulta Yhdistyvä tarke
Loikkaa: valikkoon, hakuun
Yhdistyvä tarke on erillinen merkki, joka liittyy kanta­merkkiin, niin että niistä näyttää muodos­tuvan yhte­näinen kirjain.

Yhdistyvä eli kombinoituva merkki on digitaalisessa typografiassa erityisenlainen kirjoitusmerkki, tyypillisesti tarke, jota käytetään jonkin toisen merkin lisukkeena. Se on teknisessä mielessä erillinen merkki, jolla on oma Unicode-tunnus, mutta se ei vie tekstirivillä lainkaan tilaa vaan asettuu edeltävän merkin – kantamerkin eli perusmerkin – kohdalle, niin että ne näyttävät muodostavan yhden kokonaisuuden. Yhdistyvä merkki voi asemoitua kantamerkin ylä- tai alapuolelle tai keskelle. Käytettävästä fontista ja ohjelmistosta riippuu, miten hyvin yhdistyvä merkki käytännössä osuu paikalleen.

Tietokonemerkistöissä on myös teknisesti yksinkertaisempia koostemerkkejä, joihin lähtökohtaisesti sisältyvät sekä tarke että kantamerkki. Muodollisesti koostemerkki tulkitaan samaksi kuin vastaava kantamerkin ja yhdistyvän merkin muodostama kokonaisuus eli niin sanottu hajotelma. Keskenään yhtäläisiksi on siis ymmärrettävä esimerkiksi koostemerkki š (U+0161 eli latinalainen pienaakkonen s ja hattu) ja hajotelma š (U+0073 U+030C eli latinalainen pienaakkonen s, jota seuraa yhdistyvä hattu).[1]

Yhdistyvät merkit edustavat verrattain uutta fonttitekniikkaa, joka ei aina toimi ongelmitta. Jotkin ohjelmat voivat pyrkiä kiertämään mahdolliset käytännön ongelmat korvaamalla kantamerkistä ja yhdistyvästä merkistä muodostuvan hajotelman vastaavalla koostemerkillä. Kaikki yhdistelmät eivät kuitenkaan ole saatavilla koostemerkkeinä. Unicode-merkistössä ei esimerkiksi ole akuuttiaksentilla varustettuja kyrillisiä vokaalikirjaimia, joten jos venäjänkielisessä tekstissä halutaan merkitä myös sanapainot (mikä tavallisesti tehdään vain sanakirjoissa ja kielen oppikirjoissa), kyrilliseen kirjaimeen pitää liittää yhdistyvä akuutti.

Koostemerkkien ja hajotelmien vertailua[muokkaa | muokkaa wikitekstiä]

Seuraavassa esimerkissä on sukunimi Åström kirjoitettuna ensin tavanomaisesti käyttäen koostemerkkejä Å (U+00C5) ja ö (U+00F6) ja sitten hajotelmia, joissa tarkkeetonta A-kirjainta (U+0041) seuraa yhdistyvä yläpuolinen ympyrä (U+030A) ja o-kirjainta (U+006F) yhdistyvä treema (U+0308). Eron havainnollistamiseksi kumpikin vaihtoehto on tässä lisäksi esitetty kirjain kerrallaan siten, että koostemerkit näkyvät vihreinä ja kantamerkit mustina; yhdistyvät tarkkeet voivat selaimesta ja fontista riippuen näkyä oransseina tai mustina (tai joissain selaimissa eivät ehkä lainkaan):

Åström Å s t r ö m
U+ 00C5 0073 0074 0072 00F6 006D
Åström Å s t r ö m
U+ 0041
030A
0073 0074 0072 006F
0308
006D

Värityksen eroja lukuun ottamatta nämä vaihtoehdot ovat siis periaatteessa yhtäläisiä, ja niiden pitäisi näyttää samanlaisilta. Yhdistyvät tarkkeet eivät kuitenkaan kaikissa sovelluksissa näy oikein, ja pahimmassa tapauksessa ne voivat jäädä piiloon[2] tai kantamerkin kohdalla tai perässä voi näkyä neliskulmainen korvikekuvio osoittamassa, että tarke ei sisälly käytössä olevaan fonttiin.

Toisaalta koostemerkitkään eivät aina ole ongelmattomia, sillä kovin eksoottiset merkit eivät sisälly kaikkiin fontteihin. Seuraavassa esimerkissä on rekonstruoituna indoeurooppalaisen kantakielen sana ’koira’:

ḱṷṓn n
U+ 1E31 1E77 1E53 006E
ḱṷṓn ḱ ṷ ṓ n
U+ 006B
0301
0075
032D
006F
0304
0301
006E

Joissain tilanteissa ensimmäisen vaihtoehdon harvinaisilla tarkkeilla varustetut k ja u sekä o (jonka yläpuolella on kaksi tarketta) voivat typografisesti näyttää silmiinpistävän erilaisilta kuin tarkkeeton n, ja pahimmassa tapauksessa niiden paikalla näkyy pelkkä neliskulmainen korvikekuvio. Yhdistyviä tarkkeita käytettäessä ainakin kantamerkkien pitäisi olla tunnistettavissa, vaikka selain ei yhdistyviä tarkkeita osaisikaan esittää oikein.

Käyttö[muokkaa | muokkaa wikitekstiä]

Yhdistyvien merkkien kirjoittaminen vaatii usein erityistoimia. Suomalaiseen vakionäppäimistöön kuuluvat tarkenäppäimet on vanhastaan tarkoitettu koostemerkkien kirjoittamiseen, joten niillä ei suoraan voi tuottaa yhdistyviä tarkkeita.[2] Laajennetusta suomalaisesta näppäimistöasettelusta on tosin laadittu myös muunnelmia, joiden mukainen tarkenäppäin tuottaakin yhdistyvän tarkkeen.[3] Joissain Linux-järjestelmissä (esimerkiksi Debianissa) yhdistyvän tarkkeen voi puolestaan kirjoittaa näpäyttämällä ensin erityistä yhdistelmänäppäintä (compose-näppäin, jollaiseksi usein on määritelty oikeanpuoleinen Windows-näppäin[4]) ja sen jälkeen asianmukaista tarkenäppäintä kaksi kertaa peräkkäin.

HTML-koodissa voi yhdistyvän merkin tuottaa Unicode-tunnukseen perustuvalla numeerisella merkkiviittauksella. Kun esimerkiksi yhdistyvän hatun tunnus on U+030C, vastaava merkkiviittaus on ̌ (viittaus alkaa &-merkillä ja päättyy puolipisteeseen; tunnuksen alkunollaa ei HTML-viittaukseen tarvitse sisällyttää, mutta ristikkomerkin ja x-kirjaimen yhdistelmä #x osoittaa, että kyse on heksadesimaalisesta viittauksesta). Merkkiviittaus tulee kirjoittaa välittömästi kantamerkin perään, jotta se asettuisi edeltävän merkin kohdalle:

ř

Eräät yhdistyvät tarkkeet ovat kahden kirjaimen levyisiä, niin että ne ylettyvät myös seuraavan kirjaimen päälle. Tällöin yhdistyvä merkki kirjoitetaan siis tavallaan kahden kantamerkin väliin (tosin varsinainen kantamerkki on aina nimenomaan edeltävä merkki):[5]

t͡st͡s

Kantamerkkiin voi sekä sen ylä- että alapuolella liittyä useitakin yhdistyviä merkkejä, jolloin ne pinoutuvat (tai niiden pitäisi pinoutua) päällekkäin. Tällöin voi olla tarpeen kiinnittää huomiota siihen, missä järjestyksessä yhdistyvät merkit lisätään. Esimerkiksi suomalais-ugrilaisen tarkekirjoituksen ohjeistuksessa on linjattu, että ensin kuuluu kirjoittaa kirjaimen alapuoliset tarkkeet ja vasta niiden jälkeen yläpuoliset tarkkeet. Kummassakin tapauksessa ensin kirjoitetaan kantamerkkiä lähinnä oleva tarke ja sen jälkeen muut asteittain kantamerkistä loitontuen:[6]

ǡ͔ǡ͔

Yhdistyviä merkkejä Unicodessa[muokkaa | muokkaa wikitekstiä]

Seuraaviin taulukoihin on koottu yhdistyviä merkkejä ilman kantamerkkiä. Ne on järjestetty Unicode-tunnusten mukaisesti. Kaikki merkit eivät välttämättä näy selaimessa oikein.

Yhdistyviä tarkkeita[7][8]
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+030x  ̀  ́  ̂  ̃  ̄  ̅  ̆  ̇  ̈  ̉  ̊  ̋  ̌  ̍  ̎  ̏
U+031x  ̐  ̑  ̒  ̓  ̔  ̕  ̖  ̗  ̘  ̙  ̚  ̛  ̜  ̝  ̞  ̟
U+032x  ̠  ̡  ̢  ̣  ̤  ̥  ̦  ̧  ̨  ̩  ̪  ̫  ̬  ̭  ̮  ̯
U+033x  ̰  ̱  ̲  ̳  ̴  ̵  ̶  ̷  ̸  ̹  ̺  ̻  ̼  ̽  ̾  ̿
U+034x  ̀  ́  ͂  ̓  ̈́  ͅ  ͆  ͇  ͈  ͉  ͊  ͋  ͌  ͍  ͎  ͏
U+035x  ͐  ͑  ͒  ͓  ͔  ͕  ͖  ͗  ͘  ͙  ͚  ͛  ͜   ͝   ͞   ͟ 
U+036x  ͠   ͡   ͢   ͣ  ͤ  ͥ  ͦ  ͧ  ͨ  ͩ  ͪ  ͫ  ͬ  ͭ  ͮ  ͯ
  • Merkit U+0300–0333 on Unicode-standardissa luokiteltu tavanomaisiksi tarkkeiksi. Niitä voidaan käyttää monien kielten oikeinkirjoituksessa ja tieteellisessä tarkekirjoituksessa.
  • U+0334–0338 asemoituvat kantamerkin keskelle.
  • U+0339–033F ovat tarkemmin luokittelemattomia lisäyksiä.
  • U+0340 ja U+0341 ovat vietnamilaisia vanhentuneita toonimerkkejä, joiden sijasta olisi käytettävä merkkejä U+0300 ja U+0301.
  • U+0342–0345 ovat erityisesti kreikan kirjoittamiseen tarkoitettuja lisäyksiä (tosin U+0343 on määritelty yhtäläiseksi merkin U+0313 kanssa, ja merkin U+0344 sijasta suositellaan merkkien U+0308 ja U+0301 yhdistelmää).
  • U+0346–034E ovat lisäyksiä kansainvälistä tarkekirjoitusta varten (U+034B–034E erityisesti epäselvän puheen merkitsemiseksi).
  • U+034F on näkymätön. Englanninkielinen nimi grapheme joiner on harhaanjohtava, sillä merkki ei liitä kirjoitusmerkkejä yhteen.
  • U+0350–0357 ovat lisäyksiä suomalais-ugrilaista tarkekirjoitusta varten.
  • U+0358–035B ovat sekalaisia lisäyksiä.
  • U+035C–0362 ovat kahden kirjaimen levyisiä tarkkeita.
  • U+0363–036F ovat historiallisia, lähinnä keskiaikaisissa germaanisissa käsikirjoituksissa käytettyjä tarkkeita.[8]

Jos yhdistyviä ylä- tai alaviivamerkkejä (U+0305, U+0332, U+0333, U+033F) liitetään peräkkäisiin kantamerkkeihin, niistä pitäisi periaatteessa muodostua yhtenäinen ylle- tai alleviivaus, mutta tähän tarkoitukseen on suositeltavaa käyttää tavanomaisempia tyylitekniikoita.[5]

Täydennyksiä yhdistyviin tarkkeisiin[9]
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+1DCx  ᷀  ᷁  ᷂  ᷃  ᷄  ᷅  ᷆  ᷇  ᷈  ᷉  ᷊  ᷋  ᷌  ᷍   ᷎  ᷏
U+1DDx  ᷐  ᷑  ᷒  ᷓ  ᷔ  ᷕ  ᷖ  ᷗ  ᷘ  ᷙ  ᷚ  ᷛ  ᷜ  ᷝ  ᷞ  ᷟ
U+1DEx  ᷠ  ᷡ  ᷢ  ᷣ  ᷤ  ᷥ  ᷦ                  
U+1DFx                          ᷼   ᷽  ᷾  ᷿
  • U+1DC0 ja U+1DC1 ovat muinaiskreikkalaisten käsikirjoitusten korjauslukumerkkejä.
  • U+1DC2 ja U+1DC3 sekä U+1DCA ja U+1DFD ovat sekalaisia täydennyksiä.
  • U+1DC4–1DC9 sekä U+1DCB ja U+1DCC ovat muuntuvan toonin merkkejä.
  • U+1DCD on kahden kirjaimen levyinen tarke.
  • U+1DCE–1DD2 ja U+1DD3–1DE6 ovat historian, erityisesti keskiajan tutkimukseen liittyviä merkkejä.
  • U+1DFC on kahden kirjaimen levyinen tarke suomalais-ugrilaista tarkekirjoitusta varten.
  • U+1DFE ja U+1DFF ovat täydennyksiä suomalais-ugrilaista tarkekirjoitusta varten.[9]

Harmaat merkkipaikat eivät toistaiseksi ole käytössä.

Yhdistyviä tarkkeita symboleille[10]
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+20Dx  ⃐  ⃑  ⃒  ⃓  ⃔  ⃕  ⃖  ⃗  ⃘  ⃙  ⃚  ⃛  ⃜  ⃝  ⃞  ⃟
U+20Ex  ⃠  ⃡  ⃢  ⃣  ⃤  ⃥  ⃦  ⃧  ⃨  ⃩  ⃪  ⃫  ⃬  ⃭  ⃮  ⃯
U+20Fx  ⃰                              
Yhdistyviä puolikasmerkkejä[11]
  0 1 2 3 4 5 6 7 8 9 A B C D E F
U+FE2x  ︠  ︡  ︢  ︣  ︤  ︥  ︦                  

Katso myös[muokkaa | muokkaa wikitekstiä]

Lähteet[muokkaa | muokkaa wikitekstiä]

  1. Jukka K. Korpela: Kirjainten tarinoita (PDF) (luku 4.1, ”Tarkennusta tarkkeen käsitteeseen”, s. 132–133) 14.1.2011. Viitattu 8.4.2014.
  2. a b Jukka Korpela: Merkkien kirjoittaminen tietokoneella (osio ”Tarkkeiden kirjoittaminen”) Nykyajan kielenopas. 19.3.2014. Viitattu 9.4.2014.
  3. Jukka Korpela: Suomalainen monikielinen näppäimistö 18.8.2006, päivitetty 19.12.2013. Viitattu 9.4.2014.
  4. Shaun McCance ym.: Erikoismerkkien käyttäminen Gnome Help. 2005‒2014. Viitattu 9.4.2014.
  5. a b Julie D. Allen ym. (toim.): European Alphabetic Scripts (PDF) (luku 7.9, ”Combining Marks”, s. 238–244) The Unicode Standard, Version 6.1 – Core Specification. 2012. Mountain View, CA: Unicode Consortium. Viitattu 10.4.2014.
  6. Kotus: Universaalimerkistö suomalais-ugrilaisessa tarkekirjoituksessa 2009.
  7. Jukka Korpela: Tarkkeiden nimet 10.3.2005, päivitetty 12.1.2012. Viitattu 9.4.2014.
  8. a b Unicode: Combining Diacritical Marks (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
  9. a b Unicode: Combining Diacritical Marks Supplement (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
  10. Unicode: Combining Diacritical Marks for Symbols (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.
  11. Unicode: Combining Half Marks (PDF) The Unicode Standard Code Charts. 1991–2009. Viitattu 11.9.2010.