Merkkiviittaus

Wikipedia
Loikkaa: valikkoon, hakuun

Merkkiviittaus tai nimiviittaus (usein myös entiteettiviittaus tai pelkkä entiteetti) on HTML:ssä ja muissa merkintäkielissä keino sisällyttää tekstitallenteeseen sellaisia kirjoitusmerkkejä, joita ei voida kirjoittaa sellaisinaan, koska ne eivät sisälly koodattaessa käytettävään merkistöön tai näppäimistöön tai koska niille on määritetty erikoistehtäviä. Merkki- tai nimiviittaus upotetaan HTML-sivulle erityisenä koodina, joka alkaa &-merkillä ja päättyy puolipisteeseen (;). Selaimen tehtävä on esittää viittaus oikean näköisenä merkkinä, mikä tosin edellyttää, että merkki sisältyy myös käytettävään fonttiiin.

Esimerkiksi Ä-kirjain ei sisälly Ascii-merkistöön, mutta se voidaan silti koodata pelkillä Ascii-merkeillä, kun käytetään suuraakkosen nimiviittausta &Auml; tai vastaavaa pienaakkosen nimiviittausta &auml; (A-kirjaimeen liitetty lyhenne uml viittaa saksassa tavattavaan umlaut-ilmiöön, jota oikeinkirjoituksessa tavallisesti ilmentää kantakirjaimen yläpuolelle tarkkeeksi lisättävä pistepari). Pienemmyysmerkki (<) sen sijaan sisältyy Ascii-merkistöön, mutta merkintäkielissä se toimii tavallisesti alkumerkkinä (ikään kuin kulmasulkeena) piiloon jäävissä tunnisteissa eli arkikielisesti tägeissä, joilla merkitään tallennetta rakenteellisesti jäsentävien elementtien alku ja loppu. Silloin kun pienemmyysmerkin ei ole tarkoitus aloittaa tunnistetta, voidaan käyttää nimiviittausta &lt; (engl. less than ’pienempi kuin’), joka selaimessa näkyy yksinkertaisesti pienemmyysmerkkinä. Koska &-merkki puolestaan toimii nimi- tai merkkiviittauksen alkumerkkinä, sekin on korvattava nimiviittauksella &amp; (engl. ampersand) tai vastaavalla merkkiviittauksella, jos sen halutaan näkyvän omana itsenään mutta selain tulkitsisi sen viittauksen alkumerkiksi.

Sanallinen tai numeerinen viittaus[muokkaa | muokkaa wikitekstiä]

Nimiviittaus perustuu merkin (englanninkieliseen) nimeen tai lyhenteeseen, kun taas merkkiviittaus perustuu numeeriseen Unicode-tunnukseen. Nimiviittaus on määritetty vain osalle merkeistä, mutta numeerisesti voidaan viitata periaatteessa mihin tahansa Unicode-merkkiin (kontrollimerkkejä lukuun ottamatta). Unicode-tunnus esitetään tavallisesti heksadesimaalisessa muodossa, mutta etenkin merkkiviittauksessa voidaan käyttää myös vastaavaa desimaalista eli kymmenjärjestelmään perustuvaa lukua.

Esimerkiksi kreikkalainen suuraakkonen sigma (jonka tunnus on U+03A3) voidaan sisällyttää HTML-koodiin seuraavanlaisia viittauksia käyttäen:

  • nimiviittaus: &Sigma; → Σ
  • desimaalinen merkkiviittaus: &#931; → Σ
  • heksadesimaalinen merkkiviittaus: &#x3A3; → Σ

Desimaalisessa merkkiviittauksessa on siis &-merkin ja puolipisteen välissä ristikkomerkki, jota seuraa Unicode-tunnuksen arvoa vastaava kymmenjärjestelmän luku. Heksadesimaalisessa merkkiviittauksessa on ristikkomerkin lisäksi x-kirjain, jonka pitää XML- ja XHTML-koodissa olla nimenomaan pienaakkonen (sen sijaan itse heksadesimaalilukuun kuuluvat kirjaimet merkitään usein suuraakkosin, mutta pienaakkoset käyvät yhtä hyvin). Unicode-tunnuksen alkunolla voidaan merkkiviittauksesta jättää pois.

Lähteet[muokkaa | muokkaa wikitekstiä]

  • MOT: Tietotekniikan liiton ATK-sanakirja 5.0 (© Tietotekniikan liitto ry:n sanastotoimikunta).
Tämä tietotekniikkaan liittyvä artikkeli on tynkä. Voit auttaa Wikipediaa laajentamalla artikkelia.