Movatterモバイル変換


[0]ホーム

URL:


Siirry sisältöön
Wikipedia
Haku

ISO 8859-1

Wikipediasta
(Ohjattu sivultaLatin1)

ISO 8859-1 tai epävirallisestiLatin-1[1] ontietokoneissa jatietoliikenteessä käytettävämerkistö, joka on laadittu erityisesti länsieurooppalaisia kieliä silmällä pitäen. Se on ensimmäinen ja suomalaisittainkin käytännössä tärkeinISO- jaIEC-järjestöjen virallistamista kieliryhmittäisistä 8859-sarjan merkistöstandardeista. Latin 1 toimii esimerkiksiverkkosivujen oletusmerkistönä, jos käytettävää merkistöä ei ole muutoin määritetty.

ISO 8859-1 on 8-bittinen eli kaikkiaan 256 merkkipaikasta koostuva merkistö, joka voidaan määritellä 7-bittisenASCII-merkistön laajennukseksi. ASCIIta vastaavat 128 ensimmäistä merkkipaikkaa sisältävät ensisijaisestiamerikanenglannissa tarvittavia kirjoitusmerkkejä sekä eräitä teknisiä ohjauskoodeja. Tähän merkkivalikoimaan ISO 8859-1 lisää etenkin länsieurooppalaisissa kielissä tarvittavia kirjaimia, kutenÅ/å:nÄ/ä:n ja Ö/ö:n. Lisäksi ISO 8859-1:een on varattu tilaa ohjauskoodien laajennuksille, jotka standardi tosin jättää määrittämättä. Joskus ISO 8859-1 sekoitetaanWindows-1252:een eli niin sanottuun Windows Latin 1 ‑merkistöön, jossa käyttämättömille ohjauskoodien merkkipaikoille on sijoitettu vielä lisää kirjoitusmerkkejä.

YleismaailmallinenUnicode-merkistö voidaan määritellä sekä ASCIIn että ISO 8859-1:n laajennukseksi, sillä Unicoden ensimmäinen lohko elilatinalainen perusosa vastaa ASCIIta, ja ISO 8859-1:n lisäyksistä muodostuu toinen lohko eli latinalaisen merkistön täydennys Latin 1:ksi.

ISO 8859-1 ‑merkistön korvaajaksi on myöhemmin kehitettyISO 8859-15 (Latin 9), joka täydentää ranskan ja suomen tukea (mm. kirjaiminŠ/š ja Ž/ž) ja sisältää myöseuron merkin. Korvaava merkistö ei ole kuitenkaan onnistunut laajassa mitassa syrjäyttämään edeltäjäänsä. Sen sijaan kaikkien ISO 8859 ‑sarjan standardien odotetaan ajan myötä korvautuvan Unicode-merkistöllä.

Historia ja standardointi

[muokkaa |muokkaa wikitekstiä]

Merkistön virallinen nimi on ISO/IEC 8859-1, sillä sitä ylläpitävät yhteistyössäISO- jaIEC-standardointijärjestöt.IANA:n standardoinnissa merkistöstä käytetään nimeä ISO-8859-1 (jossa ISO-nimen ja numeerisen tunnuksen väliin on siis lisätty yhdysviiva). IANA määrittelee myös ohjauskoodit 00–1F ja 80–9F, joihin ISO ei ota kantaa.

ISO 8859-1 perustuu DEC Multilanguage Character Set -merkistöön, jota käytettiin ensimmäisen kerranDEC:nVT220- ja VT240-päätteissä vuonna1982. DEC:n merkistö eroaa ISO 8859-1 -merkistöstä islantilaisten merkkien osalta.

Maaliskuussa1985ECMA (European Computer Manufacturer’s Association) standardoi nykyisin nimillä ISO 8859-1:stä ISO 8859-4:ään tunnettavat merkistöt nimellä ECMA-94. ISO-standardiksi ne hyväksyttiin kuitenkin vasta vuonna1987.

Vuonna 1987 julkaistiinMS-DOS 3.30, johon sisältyvä merkistö (tai Microsoftin termistön mukaan koodisivu,engl.code page)CP850 sisältää samat merkit kuin ISO 8859-1, mutta eri järjestyksessä. ISO-merkistöä muistuttava koodisivuWindows-1252 tuli käyttöönWindows-ympäristön myötä1990-luvulla.

Unix-järjestelmissä siirtymistä hidasti päätelaitteiden kirjavuus, ja kattavaan 8-bittisen merkistön käyttöön päästiin vasta, kun vanhat päätteet korvattiin itsenäisillätyöasemakoneilla ja pääasialliseksi yhteydeksi tuliIP-protokollan avulla toimivatelnet- taiSSH-yhteys.lähde?

ISO 8859-1 -merkit

[muokkaa |muokkaa wikitekstiä]
ISO/IEC 8859-1
x0x1x2x3x4x5x6x7x8x9xAxBxCxDxExF
0xei käytössä
1x
2xSP!"#$%&'()*+,-./
3x0123456789:;<=>?
4x@ABCDEFGHIJKLMNO
5xPQRSTUVWXYZ[\]^_
6x`abcdefghijklmno
7xpqrstuvwxyz{}~
8xei käytössä
9x
AxNBSP¡¢£¤¥¦§¨©ª«¬SHY®¯
Bx°±²³´µ·¸¹º»¼½¾¿
CxÀÁÂÃÄÅÆÇÈÉÊËÌÍÎÏ
DxÐÑÒÓÔÕÖ×ØÙÚÛÜÝÞß
Exàáâãäåæçèéêëìíîï
Fxðñòóôõö÷øùúûüýþÿ

Yllä olevassa taulukossa merkit on järjestettyheksadesimaalisen koodinsa mukaisesti. Merkki 20 (SP,engl.space) on tavallinenvälilyönti ja A0 (NBSP,engl.no-break space)sitova välilyönti. Merkki AD (SHY,engl.soft hyphen) on määriteltyHTML-kielessätavutusvihjeeksi, joka on tavallisesti näkymätön mutta mahdollistaa rivinvaihdon ja sen yhteydessä muuttuu näkyväksi tavuviivaksi. Merkkiä 7F ei ole ISO 8859-1 -merkistössä määritelty, muttaASCII-merkistössä se on ohjauskoodi DEL, jota on eri tietokonejärjestelmissä käytetty vaihtelevasti (vaikka ohjauskoodin nimi tulee englannin sanastadelete ’poista’, se ei nykynäppäimistöissä kytkeydyDelete-näppäimeen).

Kattavuus

[muokkaa |muokkaa wikitekstiä]

ISO 8859-1 -merkistön avulla voi kirjoittaaalbanian,baskin,englannin,espanjan,fäärin,gaelin,hollannin,iirin,islannin,italian,katalaanin,norjan,portugalin,ranskan,retoromaanin,ruotsin,saksan,suomen jatanskan kieliä (vaikkei näistä kaikkia aivan puhdasoppisesti). Lisäksi sitä voi käyttää ainakinafrikaansin,eteläsaamen jaswahilin kirjoittamiseen.

ISO 8859-1:stä puuttuu eräitä verrattain yleisiätypografisia erikoismerkkejä, kuten kaarevalainaus- jaheittomerkki sekäajatusviiva.

Katso myös

[muokkaa |muokkaa wikitekstiä]

Lisätietoja

[muokkaa |muokkaa wikitekstiä]

Lähteet

[muokkaa |muokkaa wikitekstiä]
  1. What is the Latin-1 (ISO-8859-1) character set? kb.iu.edu. Viitattu 14.7.2020.
Noudettu kohteesta ”https://fi.wikipedia.org/w/index.php?title=ISO_8859-1&oldid=21981175
Luokka:
Piilotetut luokat:

[8]ページ先頭

©2009-2025 Movatter.jp