ISO 8859-1

Wikipedia

Loikkaa: valikkoon, hakuun

ISO 8859-1 on kahdeksanbittinen ASCII-merkistön laajennos johon on otettu mukaan useimmat länsieurooppalaiset merkit. Merkistö tukee virallisesti seuraavia kieliä: albania, baski, englanti, espanja, fääri, gaeli, hollanti, iiri, islanti, italia, katalaani, norja, portugali, retoromaani, ruotsi, saksa, suomi ja tanska. Lisäksi sitä voi käyttää ainakin afrikaansin, eteläsaamen ja swahilin kirjoittamiseen.

Merkistön seuraaja on ISO 8859-15, joka täydentää ranskan ja suomen tukea sekä lisää merkistöön euron merkin. ISO 8859-1 on kuitenkin niin laajasti käytetty, ettei sen korvaaminen ole realistisesti ollut mahdollista.

Sisällysluettelo

[muokkaa] Historia ja standardointi

ISO 8859-1 perustuu DEC Multilanguage Character Set -merkistöön jota käytettiin ensimmäisen kerran VT220 ja VT240-päätteissä vuonna 1982. DEC MCS eroaa ISO 8859-1 -merkistöstä islantilaisten merkkien osalta.

Virallisempi nimi merkistölle on ISO/IEC 8859-1 ja se tunnetaan myös nimellä Latin1 (Latinalainen 1). IANA:n standardoinnissa merkistö tunnetaan ISO-8859-1 -nimellä. IANA määrittelee myös merkitykset kontrollimerkeille 0-31 (vastaavat ASCII-merkistön merkityksiä), joihin ISO ei ota kantaa.

Maaliskuussa 1985 ECMA (European Computer Manufacturer's Association) standardoi nykyisin nimillä ISO 8859-1:stä ISO 8859-4:aan tunnettavat merkistöt ECMA-94 nimellä. ISO-standardointia saatiin kuitenkin odottaa vuoteen 1987.

Vuonna 1987 julkaistiin MS-DOS 3.30 jossa oli mukana koodisivu CP850, joka sisältää samat merkit kuin ISO 8859-1, kuitenkin eri järjestyksessä. PC-koneissa ISO-merkistöä muistuttava Windows koodisivu-1252 tuli käyttöön lopulta Windows-ympäristön mukana 1990-luvulla. UNIX-puolella siirtymistä hidasti erilaisten päätelaitteiden kirjavuus, kattavaan 8-bittisen merkistön käyttöön päästiin vasta kun vanhat päätteet korvattiin itsenäisillä työasemakoneilla ja pääasialliseksi yhteydeksi UNIX-koneisiin tuli IP-verkoston kautta toimiva telnet- tai ssh-yhteys.

ISO 8859-1 laajentaa ISO 646-IRV -merkistöä kahdella lohkolla; ASCIIn kontrollimerkkien ja latinalaisen perusosan lisäksi merkistöön on lisätty laajennetut kontrollimerkit ja Latinalaisen merkistön täydennys Latin-1:ksi osa. Laajennetuille kontrollimerkeille ei ole keksitty käyttöä ja merkkipaikat ovat käyttämättä.

[muokkaa] ISO 8859-1 -merkit

ISO/IEC 8859-1
x0 x1 x2 x3 x4 x5 x6 x7 x8 x9 xA xB xC xD xE xF
0x ei käytössä
1x
2x SP ! " # $ % & ' ( ) * + , - . /
3x 0 1 2 3 4 5 6 7 8 9 : ; < = > ?
4x @ A B C D E F G H I J K L M N O
5x P Q R S T U V W X Y Z [ \ ] ^ _
6x ` a b c d e f g h i j k l m n o
7x p q r s t u v w x y z { } ~
8x ei käytössä
9x
Ax NBSP ¡ ¢ £ ¤ ¥ ¦ § ¨ © ª « ¬ SHY ® ¯
Bx ° ± ² ³ ´ µ · ¸ ¹ º » ¼ ½ ¾ ¿
Cx À Á Â Ã Ä Å Æ Ç È É Ê Ë Ì Í Î Ï
Dx Ð Ñ Ò Ó Ô Õ Ö × Ø Ù Ú Û Ü Ý Þ ß
Ex à á â ã ä å æ ç è é ê ë ì í î ï
Fx ð ñ ò ó ô õ ö ÷ ø ù ú û ü ý þ ÿ

Merkistössä merkki 20 (32 desimaalisena) on tavallinen välilyönti ja A0 sitova välilyönti. Merkki AD, SOFT HYPHEN, on määritelty HTML-kielessä tavutusvihjeeksi, eikä sen pitäisi olla näkyvissä (vaikkakaan useimmat selaimet eivät tue tavutusta). Merkkiä 7F ei ole määritelty, mutta ASCII:ssa se on kontrollimerkki, joka saadaan BackSpace-näppäimestä.

[muokkaa] Katso myös

[muokkaa] Lisätietoja

Henkilökohtaiset työkalut