KOI8-R è un sistema dicodifica di caratteri a 8-bit progettato per essere adoperato con ilrusso e con tutte quelle lingue che utilizzano l'alfabeto cirillico. Il sistema originale, il KOI8, il cui nome sta perKod Obmena Informaciej, 8 bit (inrusso Код Обмена Информацией, 8 бит,Codice per lo scambio di informazioni, 8 bit), fu progettato dalle autorità sovietiche nel1974 e da allora ne sono stati creati vari derivati, tra cui ilKOI8-U, che aggiunge al KOI8 i caratteri dell'ucraino. Il KOI8-R rimase il sistema di codifica più utilizzato anche per ilbulgaro fino a che per quest'ultimo non fu universalmente accettato l'uso delCP-1251.
Il KOI8-R ed il CP-1251 sono ancora molto più utilizzati dell'ISO 8859-5, che in effetti non ha mai trovato grande utilizzo, anche se oggi, ormai, nella stragrande maggioranza degli utilizzi moderni, viene loro preferito l'Unicode.
Il KOI8 ed i sistemi da lui derivati hanno la particolarità di avere le lettere cirilliche disposte in ordine pseudo-latino piuttosto che nel comune ordine dell'alfabeto cirillico come hanno per esempio l'ISO 8859-5 e l'Unicode. Sebbene questo possa sembrare anti intuitivo, questa caratteristica risulta utile per il fatto che se l'ottavo bit viene eliminato, il testo è parzialmente leggibile utilizzando il sistemaASCII e può essere convertito in un testo inKOI7 sintatticamente corretto. Per esempio se dalla scritta in KOI8-R "Русский Текст" viene eliminato l'ottavo bit, essa diventarUSSKIJ tEKST ("Testo russo") ed un tentativo di interpretare tale stringa con il KOI7 porta a "РУССКИЙ ТЕКСТ". Il KOI8 fu creato basandosi sulcodice Morse russo (che a sua volta fu creato dalcodice Morse internazionale basandosi sulle assonanze) e la connessione riguardante l'ordine delle lettere tra il codice Morse russo e quello internazionale è la stessa che esiste tra il KOI8 e l'ASCII.
Nelsistema operativoMicrosoft Windows, il numero di code page assegnato al sistema KOI8-R è 20866, nei sistemi diIBM è invece il numero 878.[1]
La seguente tabella mostra il sistema di codifica KOI8-R.[1] Ogni carattere è rappresentato al centro della cella con il suo equivalenteUnicode in alto e il suo codice decimale in basso.
Caratteri di controllo | Punteggiatura | ||
Cifre numeriche | Caratteri alfabetici | ||
Caratteri internazionali | Caratteri non definiti | ||
Caratteri grafici | Punteggiatura estesa |
-0 | -1 | -2 | -3 | -4 | -5 | -6 | -7 | -8 | -9 | -A | -B | -C | -D | -E | -F | |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0- | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
1- | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 |
2- | 0020 SP 32 | 0021 ! 33 | 0022 " 34 | 0023 # 35 | 0024 $ 36 | 0025 % 37 | 0026 & 38 | 0027 ' 39 | 0028 ( 40 | 0029 ) 41 | 002A * 42 | 002B + 43 | 002C , 44 | 002D - 45 | 002E . 46 | 002F / 47 |
3- | 0030 0 48 | 0031 1 49 | 0032 2 50 | 0033 3 51 | 0034 4 52 | 0035 5 53 | 0036 6 54 | 0037 7 55 | 0038 8 56 | 0039 9 57 | 003A : 58 | 003B ; 59 | 003C < 60 | 003D = 61 | 003E > 62 | 003F ? 63 |
4- | 0040 @ 64 | 0041 A 65 | 0042 B 66 | 0043 C 67 | 0044 D 68 | 0045 E 69 | 0046 F 70 | 0047 G 71 | 0048 H 72 | 0049 I 73 | 004A J 74 | 004B K 75 | 004C L 76 | 004D M 77 | 004E N 78 | 004F O 79 |
5- | 0050 P 80 | 0051 Q 81 | 0052 R 82 | 0053 S 83 | 0054 T 84 | 0055 U 85 | 0056 V 86 | 0057 W 87 | 0058 X 88 | 0059 Y 89 | 005A Z 90 | 005B [ 91 | 005C \ 92 | 005D ] 93 | 005E ^ 94 | 005F _ 95 |
6- | 0060 ` 96 | 0061 a 97 | 0062 b 98 | 0063 c 99 | 0064 d 100 | 0065 e 101 | 0066 f 102 | 0067 g 103 | 0068 h 104 | 0069 i 105 | 006A j 106 | 006B k 107 | 006C l 108 | 006D m 109 | 006E n 110 | 006F o 111 |
7- | 0070 p 112 | 0071 q 113 | 0072 r 114 | 0073 s 115 | 0074 t 116 | 0075 u 117 | 0076 v 118 | 0077 w 119 | 0078 x 120 | 0079 y 121 | 007A z 122 | 007B { 123 | 007C | 124 | 007D } 125 | 007E ~ 126 | 127 |
8- | 2500 ─ 128 | 2502 │ 129 | 250C ┌ 130 | 2510 ┐ 131 | 2514 └ 132 | 2518 ┘ 133 | 251C ├ 134 | 2524 ┤ 135 | 252C ┬ 136 | 2534 ┴ 137 | 253C ┼ 138 | 2580 ▀ 139 | 2584 ▄ 140 | 2588 █ 141 | 258C ▌ 142 | 2590 ▐ 143 |
9- | 2591 ░ 144 | 2592 ▒ 145 | 2593 ▓ 146 | 2320 ⌠ 147 | 25A0 ■ 148 | 2219 ∙ 149 | 221A √ 150 | 2248 ≈ 151 | 2264 ≤ 152 | 2265 ≥ 153 | 00A0 NBSP 154 | 2321 ⌡ 155 | 00B0 ° 156 | 00B2 ² 157 | 00B7 · 158 | 00F7 ÷ 159 |
A- | 2550 ═ 160 | 2551 ║ 161 | 2552 ╒ 162 | 0451 ё 163 | 2553 ╓ 164 | 2554 ╔ 165 | 2555 ╕ 166 | 2556 ╖ 167 | 2557 ╗ 168 | 2558 ╘ 169 | 2559 ╙ 170 | 255A ╚ 171 | 255B ╛ 172 | 255C ╜ 173 | 255D ╝ 174 | 255E ╞ 175 |
B- | 255F ╟ 176 | 2560 ╠ 177 | 2561 ╡ 178 | 0401 Ё 179 | 2562 ╢ 180 | 2563 ╣ 181 | 2564 ╤ 182 | 2565 ╥ 183 | 2566 ╦ 184 | 2567 ╧ 185 | 2568 ╨ 186 | 2569 ╩ 187 | 256A ╪ 188 | 256B ╫ 189 | 256C ╬ 190 | 00A9 © 191 |
C- | 044E ю 192 | 0430 а 193 | 0431 б 194 | 0446 ц 195 | 0434 д 196 | 0435 е 197 | 0444 ф 198 | 0433 г 199 | 0445 х 200 | 0438 и 201 | 0439 й 202 | 043A к 203 | 043B л 204 | 043C м 205 | 043D н 206 | 043E о 207 |
D- | 043F п 208 | 044F я 209 | 0440 р 210 | 0441 с 211 | 0442 т 212 | 0443 у 213 | 0436 ж 214 | 0432 в 215 | 044C ь 216 | 044B ы 217 | 0437 з 218 | 0448 ш 219 | 044D э 220 | 0449 щ 221 | 0447 ч 222 | 044A ъ 223 |
E- | 042E Ю 224 | 0410 А 225 | 0411 Б 226 | 0426 Ц 227 | 0414 Д 228 | 0415 Е 229 | 0424 Ф 230 | 0413 Г 231 | 0425 Х 232 | 0418 И 233 | 0419 Й 234 | 041A К 235 | 041B Л 236 | 041C М 237 | 041D Н 238 | 041E О 239 |
F- | 041F П 240 | 042F Я 241 | 0420 Р 242 | 0421 С 243 | 0422 Т 244 | 0423 У 245 | 0416 Ж 246 | 0412 В 247 | 042C Ь 248 | 042B Ы 249 | 0417 З 250 | 0428 Ш 251 | 042D Э 252 | 0429 Щ 253 | 0427 Ч 254 | 042A Ъ 255 |
-0 | -1 | -2 | -3 | -4 | -5 | -6 | -7 | -8 | -9 | -A | -B | -C | -D | -E | -F |
Altri progetti