Ero sivun ”ASCII” versioiden välillä

Wikipediasta
Siirry navigaatioon Siirry hakuun
[arvioimaton versio][arvioimaton versio]
Poistettu sisältö Lisätty sisältö
DixonDBot (keskustelu | muokkaukset)
p r2.6.5) (Botti poisti: ksh:ASCII
EmausBot (keskustelu | muokkaukset)
p r2.6.4) (Botti lisäsi: mhr:ASCII
Rivi 102: Rivi 102:
[[no:ASCII]]
[[no:ASCII]]
[[nn:ASCII]]
[[nn:ASCII]]
[[mhr:ASCII]]
[[nds:ASCII]]
[[nds:ASCII]]
[[pl:ASCII]]
[[pl:ASCII]]

Versio 5. huhtikuuta 2011 kello 08.45

Ascii-merkistön kirjoitusmerkit.

Ascii (akronyymi sanoista American Standard Code for Information Interchange) on 7-bittinen eli 128 merkkipaikan laajuinen tietokoneiden merkistö, joka sisältää ensisijaisesti amerikanenglannissa tarvittavat kirjaimet, numerot, väli- ja erikoismerkkejä sekä eräitä ohjauskoodeja. Lähes kaikkien nykyisin yleisessä käytössä olevien tietokonemerkistöjen 128 ensimmäistä merkkiä ovat samat kuin Asciissa, joten ne voidaan luokitella Asciin laajennuksiksi. Unicode-merkistön yhteydessä tätä ensimmäistä lohkoa kutsutaan latinalaiseksi perusosaksi.

Joskus kuulee virheellisesti puhuttavan ”8-bittisestä Asciista” tai ”high-Asciista”, jonka merkkipaikkojen määrä olisi kaksinkertaistettu 256:een ottamalla käyttöön Asciissa ylimääräiseksi jäänyt tavun kahdeksas bitti. Tällaisia merkistöjä on Asciin pohjalta kuitenkin kehitetty useita, eikä niistä yhteenkään ole asianmukaista viitata nimellä Ascii. Koska 8-bittiseenkään merkistöön eivät mahdu edes kaikkien latinalaisin aakkosin kirjoitettavien kielten kirjaimet, alueittain on pitänyt kehittää keskenään yhteensopimattomia laajennusversioita, joista länsieurooppalaisittain ja suomalaisittain tärkein on ISO 8859-1 eli niin sanottu Latin 1 ‑merkistö. Lisäksi esimerkiksi MS-DOS-järjestelmän käyttämien Ascii-pohjaisten merkistöjen laajennusosat poikkeavat täysin Windowsin merkistöistä, jotka ovat ISO 8859 ‑standardien muunnelmia.

Historia

Ascii kehitettiin 1960-luvulla paperille tulostavien kaukokirjoitinlaitteiden ja tietokonepäätteiden merkistöksi ja ohjauskoodistoksi. Aikaisemmat laitteet käyttivät yleensä 5-bittistä Baudot-koodia. Asciin kehitti Bob Bemer.

Merkkivalikoima perustuu lähinnä Yhdysvaltojen tarpeisiin. Tämä on aiheuttanut jatkuvia ongelmia ei-englanninkielisen tekstin käsittelyssä: esimerkiksi suomen kielen aakkosista kirjaimet A–Z sisältyvät kaikkiin Ascii-merkistön muunnoksiin ja näkyvät siis käytännössä aina oikein, mutta niin sanotut ääkköset (Å, Ä, Ö) aiheuttavat yllättävän usein yhteensopivuusongelmia vielä nykyäänkin.

US-Ascii

Ascii-määritys julkaistiin Yhdysvalloissa ANSI X3.4 ‑standardina vuonna 1968. ISO-standardi Asciista tuli vuonna 1972, mutta kansainvälinen ISO-646-IRV (international reference version) ‑määritys erosi alkuperäisestä Asciista sikäli, että dollarin merkin ($) tilalla oli valuuttamerkki (¤). Vuonna 1991 kansainvälinen versio mukautettiin vallitsevaan käytäntöön korvaamalla valuuttamerkki dollarin merkillä, joten se on nykyään aivan samanlainen kuin yhdysvaltalainen versio ISO-646-US eli US-Ascii.

Ascii-merkistö määrittää 128 merkkipaikkaa, joihin kuuluvat amerikanenglannin isot- ja pienet kirjaimet A–Z, numerot 0–9 sekä väli- ja erikoismerkkejä (!"#$%&'<>=?.,:;@{[|]}\^_`). Merkistön alkupäässä on osa merkkipaikoista varattu ohjauskoodeille, joten erilaisia kirjoitusmerkkejä mahtuu merkistöön alle sata.

US-Ascii ei sisällä Ä- ja Ö-kirjainten kaltaisia Euroopan kielissä tarvittavia merkkejä. Monet kansalliset kirjaimet sai kuitenkin paperipäätteillä aikaiseksi tulostamalla kaksi merkkiä päällekkäin, esimerkiksi ä ← a + " (a ja pystylainausmerkki) ja ñ ← n + ~ (n ja tilde). Eräät US-Asciin merkit, kuten tilde ja sirkumfleksi (^), tarkoitettiinkin alun perin nimenomaan tarkkeiksi kansainvälisten kirjainten muodostusta varten, samoin kuin alaviiva (_) tarkoitettiin alleviivausten tuottamiseen. Usean merkin tulostaminen samaan kohtaan ei kuitenkaan ollut mahdollista näyttöpäätteissä, joten niiden yleistyessä piti kansalliset kirjaimet viimeistään saada osaksi varsinaista merkistöä.

Kansalliset muunnelmat

Euroopan maissa kansalliset merkit saatiin käyttöön korvaamalla niillä osa erikoismerkeistä. Esimerkiksi Asciin suomalainen versio (ISO-646-SF) korvasi merkit [\]^ merkeillä ÄÖÅÜ ja {|}~ merkeillä äöåü. @ korvattiin é:llä. Tämä standardi tunnetaan myös suomalaisella nimellä SF-2.

Ratkaisu oli kömpelö, etenkin jos päätettä käytettiin ohjelmointiin, koska silloin oli usein tehtävä valinta ääkkösten ja ohjelmoinnissa välttämättömien hakasulkujen välillä. Tällaiset merkistöt olivat kuitenkin yleisiä vielä 1980-luvulla, kun käytössä oli paljon näyttöpäätteitä, joiden merkistökoodauksen leveys rajoittui 7 bittiin.

Ascii-merkit

| 00 nul| 01 soh| 02 stx| 03 etx| 04 eot| 05 enq| 06 ack| 07 bel|
| 08 bs | 09 ht | 0a nl | 0b vt | 0c np | 0d cr | 0e so | 0f si |
| 10 dle| 11 dc1| 12 dc2| 13 dc3| 14 dc4| 15 nak| 16 syn| 17 etb|
| 18 can| 19 em | 1a sub| 1b esc| 1c fs | 1d gs | 1e rs | 1f us |
| 20 sp | 21  ! | 22  " | 23  # | 24  $ | 25  % | 26  & | 27  ' |
| 28  ( | 29  ) | 2a  * | 2b  + | 2c  , | 2d  - | 2e  . | 2f  / |
| 30  0 | 31  1 | 32  2 | 33  3 | 34  4 | 35  5 | 36  6 | 37  7 |
| 38  8 | 39  9 | 3a  : | 3b  ; | 3c  < | 3d  = | 3e  > | 3f  ? |
| 40  @ | 41  A | 42  B | 43  C | 44  D | 45  E | 46  F | 47  G |
| 48  H | 49  I | 4a  J | 4b  K | 4c  L | 4d  M | 4e  N | 4f  O |
| 50  P | 51  Q | 52  R | 53  S | 54  T | 55  U | 56  V | 57  W |
| 58  X | 59  Y | 5a  Z | 5b  [ | 5c  \ | 5d  ] | 5e  ^ | 5f  _ |
| 60  ` | 61  a | 62  b | 63  c | 64  d | 65  e | 66  f | 67  g |
| 68  h | 69  i | 6a  j | 6b  k | 6c  l | 6d  m | 6e  n | 6f  o |
| 70  p | 71  q | 72  r | 73  s | 74  t | 75  u | 76  v | 77  w |
| 78  x | 79  y | 7a  z | 7b  { | 7c  | | 7d  } | 7e  ~ | 7f del|

Katso myös

Aiheesta muualla

Malline:Link FA Malline:Link FA