Movatterモバイル変換


[0]ホーム

URL:


Pergi ke kandungan
WikipediaEnsiklopedia Bebas
Cari

Unicode

Daripada Wikipedia, ensiklopedia bebas.
Rencana ini mengandungiBantuan:Aksara khas. Tanpasokongan paparan yang betul, anda mungkin melihattanda soal, kotak, atau simbol lain.

Unicode ialahpiawaian industri yang membolehkankomputer untuk melambangkan dan memanipulasiteks yang diekspresikan dalam mana-manasistem tulisan di dunia secara konsisten. Unicode yang dibangunkan seiringan dengan piawaianSet Aksara Universal dan diterbit dalam bentuk buku sebagaiThe Unicode Standard, Unicode terdiri daripada himpunan kira-kira 100,000[1]aksara, satu set carta kod bagi rujukan visual, kaedah pengekodan dan setpengekodan aksara piawai, penyebutan ciri-ciri aksara seperti huruf besar atau kecil, satu setfail komputer data rujukan, dan peraturan untuk penyeragaman, penguraian,pengumpulsemakan dan pengemukaan aksara.

Konsortium Unicode, sebuah pertubuhan bukan untung yang menyelaras pembangunan Unicode, memegang cita-cita untuk menggantikan skema pengekodan aksara sedia ada dengan Unicode dan skema-skema Unicode Transformation Format (UTF) piawainya, kerana kebanyakan skema pengekodan sedia ada terhad saiz dan skopnya serta tidak serasi dengan persekitaranpelbagai bahasa. Kejayaan Unicode dalam menyatukan set-set aksara telah mencetuskan penggunakan meluas dan dominan dalampengantarabangsaan danpenyetempatanperisian komputer. Piawaian ini telah dilaksanakan dalam banyak hasil teknologi terkini, termasukXML,Java dansistem pengendalian moden.

Asal-usul dan pembangunan

[sunting |sunting sumber]

Unicode jelasnya bertujuan mencecah had-hadpengekodan aksara tradisional, seperti yang didefinasikan dalam piawaianISO 8859 yang didapati luas penggunaannya di pelbagai negaa di dunia tetapi masih amat tidak serasi dengan satu sama lain. Kebanyakan pengekodan aksara tradisional berkongsi satu masalah utama yang mana pemprosesan komputer dwibahasa dibenarkan (lazimnya menggunakanhuruf rumi dan bahasa tempatan) tetapi tidak pula pemprosesan komputer berbilang bahasa (pemprosesan komputer sembarangan bahasa yang dicampur aduk dengan satu sama lain).

Unicode diniatkan untuk mengekodaksara asasnya —grafem dan unit seakan-akan grafem — dan bukannya pelbagaiglif (pengemukaan) bagi aksara sedemikian. Mengenaiaksara Cina, kadang-kadang ini menyebabkan kontroversi mengenai membezakan aksara asas dari pelbagai glifnya (lihatpenyatuan Han).

Dalam pemprosesan teks, Unicode memainkan peranan membekalkantitik kod (code point) yang unik — nombor, bukan glif — bagi setiap satu aksara. dalam erti kata lain, Unicode melambangkan sesuatu aksara secara abstrak lalu menyerahkan pengemukaan visual (saiz, bentuk,fon atau gaya) kepada perisian lain, sepertipelayar web ataupemproses kata. Namun begitu, sasaran mudah ini bertambah rumit akibat konsesi yang dilakukan oleh pereka-pereka Unicode dengan harapan mempercepatkan pengambilan Unicode.

256 titik kod yang pertama dijadikan seiras kepada kandunganISO 8859-1 agar menjadikannya tidak penting untuk menukarkan teks Barat yang sedia ada. Banyak aksara yang seiras secara pokoknya telah dikodkan banyak kali di titik kod berbeza untuk mengekalkan pembezaan yang dipakai oleh pengekodan terdahulu, maka membenarkan penukaran dari pengekodan tersebut ke Unicode secara ulang alik tanpa keciciran apa-apa maklumat. Contohnya, seksyen titik kod "bentuk lebar penuh" merangkumi abjad rumi penuh yang berasingan daripada seksyen abjad rumi utama. Dalam fon bahasa Cina, Jepun dan Korea (CJK), aksara-aksara ini dikemukakan pada lebar yang sama sepertiideograf CJK dan bukannya separuh lebar. Bagi contoh lain, lihatAksara pendua di Unicode.

Selain itu, sementara membolehkanpenggabungan aksara Unicode juga mengandungi versipragubah bagi kebanyakan kombinasi huruf/diakritik dalam kegunaan seharian. ini memudahkan lagi penukaran ulang alik dari pengekodan terdahulu serta membolehkan aplikasi untuk menggunakan Unicode sebagai format teks dalaman tanpa perlu melaksanakan aksara gabungan. Contohnyaé boleh diwakili di Unicode sebagai U+0065 (Latin small letter e) diikuti U+0301 (combining acute) tetapi boleh juga diwakili dengan aksara pragubah U+00E9 (Latin small letter e with acute).

Piawaian Unicode juga merangkumi sebilangan butiran berkaitan, seperti ciri-ciri aksara, penyeragaman bentuk teks dan susunan paparan dwiarah (bagi pemaparan sempurna bagi teks yang mengandungi kedua-dua skrip kanan-ke-kiri, sepertibahasa Arab atauIbrani, serta skrip kiri-ke-kanan).

Skrip-skrip yang diliputi

[sunting |sunting sumber]

Unicode meliputi hampir kesemua (sistem tulisan) yang dipakai pada zaman sekarang, termasuk:

Unicode telah menambah skrip-skrip selanjutnya dan akan meliputi banyak lagi, termasuk skrip-skrip bersejarah yang kurang diamalkan pada masa sekarang1 serta juga bahasa pupus bagi kegunaan akademik:

Rujukan

[sunting |sunting sumber]
  1. ^http://www.unicode.org/standard/principles.html#What_Characters

Pautan luar

[sunting |sunting sumber]
Wikimedia Commons mempunyai media berkaitanUnicode
Kawalan kewibawaan: Perpustakaan negaraSunting ini di Wikidata
Diambil daripada "https://ms.wikipedia.org/w/index.php?title=Unicode&oldid=5286651"
Kategori:
Kategori-kategori tersembunyi:

[8]ページ先頭

©2009-2025 Movatter.jp