Lanormalisation Unicode est unenormalisation de texte qui transforme des caractères ou séquences de caractères équivalents en représentation fondamentale afin que celle-ci puisse être facilement comparée.
La décomposition canonique peut être utilisée dans l’échange normalisé de textes. Elle permet d’effectuer une comparaison binaire tout en conservant une équivalence canonique avec le texte non normalisé d’origine.
Les caractères sont décomposés par équivalence canonique et réordonnés.
| chaîne | caractères | caractères normalisés | chaîne normalisée | |
|---|---|---|---|---|
| À | A +◌̀ | = | A +◌̀ | À |
| ẹ́ | e +◌́ +◌̣ | → | e +◌̣ +◌́ | ẹ́ |
| ñ | ñ | → | n +◌̃ | ñ |
| Ω (ohm) | Ω | → | Ω | Ω (oméga) |
| fi (ligature) | fi | = | fi | fi (ligature) |
| ² (exposant) | ² | = | ² | ² (exposant) |
| 한 | 한 | → | ᄒ +ᅡ +ᆫ | 한 |
| が | か +◌゙ | = | か +◌゙ | が |
| ئ | ئ | → | ي +◌ٔ | ئ |
| בּ | בּ | → | ב +◌ּ | בּ |
Les caractères sont décomposés par équivalence canonique, réordonnés, et composés par équivalence canonique.
| chaîne | caractères | caractères normalisés | chaîne normalisée | |
|---|---|---|---|---|
| À | A +◌̀ | → | À | À |
| ẹ́ | e +◌́ +◌̣ | → | ẹ +◌́ | ẹ́ |
| ñ | ñ | = | ñ | ñ |
| Ω (ohm) | Ω | → | Ω | Ω (oméga) |
| fi (ligature) | fi | = | fi | fi (ligature) |
| ² (exposant) | ² | = | ² | ² (exposant) |
| 한 | 한 | = | 한 | 한 |
| が | か +◌゙ | → | が | が |
| ئ | ئ | = | ئ | ئ |
| בּ | בּ | → | ב +◌ּ | בּ |
Les caractères sont décomposés par équivalence canonique et de compatibilité, et sont réordonnés.
| chaîne | caractères | caractères normalisés | chaîne normalisée | |
|---|---|---|---|---|
| À | A +◌̀ | = | A +◌̀ | À |
| ẹ́ | e +◌́ +◌̣ | → | e +◌̣ +◌́ | ẹ́ |
| ñ | ñ | → | n +◌̃ | ñ |
| Ω (ohm) | Ω | → | Ω | Ω (oméga) |
| fi (ligature) | fi | → | f +i | fi |
| ² (exposant) | ² | → | 2 | 2 |
| 한 | 한 | → | ᄒ +ᅡ +ᆫ | 한 |
| が | か +◌゙ | = | か +◌゙ | が |
| ئ | ئ | → | ي +◌ٔ | ئ |
| בּ | בּ | → | ב +◌ּ | בּ |
Les caractères sont décomposés par équivalence canonique et de compatibilité, sont réordonnés et sont composés par équivalence canonique.
| chaîne | caractères | caractères normalisés | chaîne normalisée | |
|---|---|---|---|---|
| À | A +◌̀ | → | À | À |
| ẹ́ | e +◌́ +◌̣ | → | ẹ +◌́ | ẹ́ |
| ñ | ñ | = | ñ | ñ |
| Ω (ohm) | Ω | → | Ω | Ω (oméga) |
| fi (ligature) | fi | → | f +i | fi |
| ² (exposant) | ² | → | 2 | 2 |
| 한 | 한 | = | 한 | 한 |
| が | か +◌゙ | → | が | が |
| ئ | ئ | = | ئ | ئ |
| בּ | בּ | → | ב +◌ּ | בּ |
| Jeux de caractères de base | ||
|---|---|---|
| Codification de fichiers et protocoles | ||
| Adaptations de référence |
| |
| Équivalences standards | ||
| Propriétés et algorithmes |
| |
| Transformations | ||
| Standards et normes liés |
| |
| Mises en œuvre et applications | ||