Movatterモバイル変換

Unicode

Wikipedia, Entziklopedia askea

Unicode testu-karaktereak edozein hizkuntzatan informatikoki adierazteko balio duenkodifikazio-sistema standar erabiliena da. UNICODEkoUTF-8 kodetze-modua erabiliena da egun. Alfabeto guztiak (latindarra,grekoa,zirilikoa‎,arabiarra...) erabiltzeko aukera eskaintzen du.

Sistema berri horren zabalpena orokorra da: bestekodifikazio-sistemak ordezkatzen ari da, horiek ezin baitituzte hainbat hizkuntzatako karaktere asko adierazi. Gaur egun, nazioarteko proiektu gehienetan erabiltzen den estandarraUTF-8 da; teknologia berri gehienek darabilte.Unicode Technical Committee (UTC) erakundeak kudeatzen du; hor, enpresa hauek parte hartzaileak dira:Microsoft,Apple,Adobe,IBM,Oracle,SAP,Google etaYahoo!.Berkeley-ko Unibertsitateak ere esku hartzen du, bai eta zenbait akademikok eta profesionalek ere.^[1] 1991z Unicode Consortium eta ISO/IEC erakundeak ados jartzen dira karakteren kode berak erabiltzeko.

Lehenago, karaktere latinoentarako erabiltzen zenASCII karaktere multzoan oinarrituta dago, hizkuntza guztien karaktereak kodetzea ahalbidetzearren 16biteko eredu bat hartu zuen hasieran, kontrol-kodeak edo ihes-sekuentziak sartu beharrik gabe.

Txinerakoyue karakterea (U+6708)
A letra latindarra (U+0041)
"Aum" (ॐ) (U+0950)

Kodetze moduak.

[aldatu |aldatu iturburu kodea]

Unicode kodetze-balioak zenbaki osoen bidez identifikatzen dira. Bere arkitekturaren arabera, ordenagailuak 8, 16 edo 32 biteko unitateak erabiltzen ditu zenbaki oso horiek adierazteko. Unicoderen kodetze moduek arautzen dute alfabeto bakoitzeko karaktere bakoitzari zein balio dagokion.

Unicodek hiru kodetze-modu definitzen ditu UTF (Unicode Transformation Format: Unicoderen transformazio-formatua) izenaren pean.

UTF-8: 8 biteko kodetzea, alegia byte batekoa, luzera aldakorreko ikurrak dituena.
UTF-16: 16 biteko kodetzea, luzera aldakorreko ikurrak dituena eta oinarrizko plano eleanitzerako (BMPrako) optimizatua.
UTF-32: 32 biteko kodetzea, luzera finkoko ikurrak dituena.

Adibideak

[aldatu |aldatu iturburu kodea]

Hauek dira zenbait karaktere latindarri dagozkien Unicode zenbakiak

	!	"	#	$	%	&	'	(	)	*	+	,	-	.	/
32	33	34	35	36	37	38	39	40	41	42	43	44	45	46	47
0	1	2	3	4	5	6	7	8	9	:	;	<	=	>	?
48	49	50	51	52	53	54	55	56	57	58	59	60	61	62	63
@	A	B	C	D	E	F	G	H	I	J	K	L	M	N	O
64	65	66	67	68	69	70	71	72	73	74	75	76	77	78	79

Erreferentziak

[aldatu |aldatu iturburu kodea]

↑.

Ikus, gainera

[aldatu |aldatu iturburu kodea]

Kanpo estekak

[aldatu |aldatu iturburu kodea]

(Ingelesez)Unicode Consortium

Autoritate kontrola	Wikimedia proiektuak Datuak:Q8819 Multimedia:Unicode /Q8819 Identifikadoreak GND:4343497-6 LCCN:sh98000843 NKC:ph571669 Open Library:OL31212836W Hiztegiak eta entziklopediak Britannica:url

Datuak:Q8819
Multimedia:Unicode /Q8819

"https://eu.wikipedia.org/w/index.php?title=Unicode&oldid=9227651"(e)tik eskuratuta

Ezkutuko kategoriak:

[8]ページ先頭

©2009-2026 Movatter.jp