Movatterモバイル変換


[0]ホーム

URL:


Edukira joan
WikipediaEntziklopedia askea
Bilatu

Unicode

Wikipedia, Entziklopedia askea

Unicode testu-karaktereak edozein hizkuntzatan informatikoki adierazteko balio duenkodifikazio-sistema standar erabiliena da. UNICODEkoUTF-8 kodetze-modua erabiliena da egun. Alfabeto guztiak (latindarra,grekoa,zirilikoa‎,arabiarra...) erabiltzeko aukera eskaintzen du.

Sistema berri horren zabalpena orokorra da: bestekodifikazio-sistemak ordezkatzen ari da, horiek ezin baitituzte hainbat hizkuntzatako karaktere asko adierazi. Gaur egun, nazioarteko proiektu gehienetan erabiltzen den estandarraUTF-8 da; teknologia berri gehienek darabilte.Unicode Technical Committee (UTC) erakundeak kudeatzen du; hor, enpresa hauek parte hartzaileak dira:Microsoft,Apple,Adobe,IBM,Oracle,SAP,Google etaYahoo!.Berkeley-ko Unibertsitateak ere esku hartzen du, bai eta zenbait akademikok eta profesionalek ere.[1] 1991z Unicode Consortium eta ISO/IEC erakundeak ados jartzen dira karakteren kode berak erabiltzeko.

Lehenago, karaktere latinoentarako erabiltzen zenASCII karaktere multzoan oinarrituta dago, hizkuntza guztien karaktereak kodetzea ahalbidetzearren 16biteko eredu bat hartu zuen hasieran, kontrol-kodeak edo ihes-sekuentziak sartu beharrik gabe.

  • Txinerako yue karakterea (U+6708)
    Txinerakoyue karakterea (U+6708)
  • A letra latindarra (U+0041)
    A letra latindarra (U+0041)
  • "Aum" (ॐ) (U+0950)
    "Aum" (ॐ) (U+0950)

Kodetze moduak.

[aldatu |aldatu iturburu kodea]

Unicode kodetze-balioak zenbaki osoen bidez identifikatzen dira. Bere arkitekturaren arabera, ordenagailuak 8, 16 edo 32 biteko unitateak erabiltzen ditu zenbaki oso horiek adierazteko. Unicoderen kodetze moduek arautzen dute alfabeto bakoitzeko karaktere bakoitzari zein balio dagokion.

Unicodek hiru kodetze-modu definitzen ditu UTF (Unicode Transformation Format: Unicoderen transformazio-formatua) izenaren pean.

  • UTF-8: 8 biteko kodetzea, alegia byte batekoa, luzera aldakorreko ikurrak dituena.
  • UTF-16: 16 biteko kodetzea, luzera aldakorreko ikurrak dituena eta oinarrizko plano eleanitzerako (BMPrako) optimizatua.
  • UTF-32: 32 biteko kodetzea, luzera finkoko ikurrak dituena.

Adibideak

[aldatu |aldatu iturburu kodea]

Hauek dira zenbait karaktere latindarri dagozkien Unicode zenbakiak

 !"#$%&'()*+,-./
32333435363738394041424344454647
0123456789:;<=>?
48495051525354555657585960616263
@ABCDEFGHIJKLMNO
64656667686970717273747576777879

Erreferentziak

[aldatu |aldatu iturburu kodea]
  1. .

Ikus, gainera

[aldatu |aldatu iturburu kodea]

Kanpo estekak

[aldatu |aldatu iturburu kodea]
Autoritate kontrola

"https://eu.wikipedia.org/w/index.php?title=Unicode&oldid=9227651"(e)tik eskuratuta
Kategoriak:
Ezkutuko kategoriak:

[8]ページ先頭

©2009-2026 Movatter.jp