UTF-8

Kod noktasının bit sayısı	İlk kod noktası	Son kod noktası	Kod birimi (bayt) sayısı	1. Bayt	2. Bayt	3. Bayt	4. Bayt	5. Bayt	6. Bayt
7	U+0000	U+007F	1	`0xxxxxxx`
11	U+0080	U+07FF	2	`110xxxxx`	`10xxxxxx`
16	U+0800	U+FFFF	3	`1110xxxx`	`10xxxxxx`	`10xxxxxx`
21	U+10000	U+1FFFFF	4	`11110xxx`	`10xxxxxx`	`10xxxxxx`	`10xxxxxx`
26	U+200000	U+3FFFFFF	5	`111110xx`	`10xxxxxx`	`10xxxxxx`	`10xxxxxx`	`10xxxxxx`
31	U+4000000	U+7FFFFFFF	6	`1111110x`	`10xxxxxx`	`10xxxxxx`	`10xxxxxx`	`10xxxxxx`	`10xxxxxx`

Kod noktasının
bit sayısı

İlk
kod noktası

Son
kod noktası

Kod birimi
(bayt) sayısı

1. Bayt

2. Bayt

3. Bayt

4. Bayt

5. Bayt

6. Bayt

U+0000

U+007F

0xxxxxxx

U+0080

U+07FF

110xxxxx

10xxxxxx

U+0800

U+FFFF

1110xxxx

10xxxxxx

U+10000

U+1FFFFF

11110xxx

10xxxxxx

U+200000

U+3FFFFFF

111110xx

10xxxxxx

U+4000000

U+7FFFFFFF

1111110x

10xxxxxx

g t d Karakter kodlamaları
Karakter setleri
ISO/IEC 8859	-1 -2 -3 -4 -5 -6 -7 -8 -9 -10 -11 -12 -13 -14 -15 -16
Bibliyografik kullanım	ANSEL ISO 5426 / 5426-2 / 5427 / 5428 /6438 / 6861 / 6862 / 10585 / 10586 / 10754 / 11822 MARC-8
Ulusal Standartlar	ArmSCII CNS 11643 GOST 10859 GB 18030 HKSCS ISCII JIS X 0201 JIS X 0208 JIS X 0212 JIS X 0213 KPS 9566 KS X 1001 PASCII SI 960 TIS-620 TSCII VISCII YUSCII
EUC	CN JP KR TW
ISO/IEC 2022	CN JP KR CCCII
MacOS kod sayfaları	Arapça Basitleştirilmiş Çince /EUC-CN Geleneksel Çince /Big5 Hırvatça Kiril Devanagari Farsça Yunanca Gujarati dili Gurmukhi dili İbranice İzlandaca Japonca /Shift JIS Korece /EUC-KR Rumence Sembol Tay dili /TIS-620 Türkçe Ukraynaca
DOS kod sayfaları	111 112 113 151 161 162 163 164 165 437 667 668 708 720 737 770 771 772 773 774 775 790 808 819 850 851 852 853 854 855 856 857 858 859 860 861 862 863 864 865 866 867 868 869 872 881 882 883 884 885 895 900 912 915 932 934 936 938 991 Kamenický Mazovia MIK Iran System
Platforma özgü	ATASCII CDC görüntü kodu DEC-MCS DEC Radix-50 Fieldata GSM 03.38 HP roman8 PETSCII TI calculator character sets Wang International Standard Code for Information Interchange ZX Spectrum character set
Unicode /ISO/IEC 10646	UTF-8 UTF-16/UCS-2 UTF-32/UCS-4 UTF-7 UTF-1 UTF-EBCDIC GB 18030 SCSU BOCU-1
Diğer	APL Cork HZ IBM code page 1133 KOI8 TRON
İlgili konular	kontrol karakteri CCSID Karakter seti saptama Han birleştirmesi ISO 6429/IEC 6429/ANSI X3.64 mojibake

Movatterモバイル変換