Movatterモバイル変換


[0]ホーム

URL:


Aller au contenu
Wikipédial'encyclopédie libre
Rechercher

Normalisation Unicode

Un article de Wikipédia, l'encyclopédie libre.

Lanormalisation Unicode est unenormalisation de texte qui transforme des caractères ou séquences de caractères équivalents en représentation fondamentale afin que celle-ci puisse être facilement comparée.

La décomposition canonique peut être utilisée dans l’échange normalisé de textes. Elle permet d’effectuer une comparaison binaire tout en conservant une équivalence canonique avec le texte non normalisé d’origine.

NFD

[modifier |modifier le code]

Les caractères sont décomposés par équivalence canonique et réordonnés.

Exemples NFD
chaînecaractères caractères
normalisés
chaîne
normalisée
AU+0041 +◌̀U+0300=AU+0041 +◌̀U+0300
ẹ́eU+0065 +◌́U+0301 +◌̣U+0323eU+0065 +◌̣U+0323 +◌́U+0301ẹ́
ññU+00F1nU+006E +◌̃U+0303
(ohm)U+2126ΩU+03A9Ω (oméga)
fi (ligature)U+FB01=U+FB01fi (ligature)
² (exposant)²U+00B2=²U+00B2² (exposant)
U+D55CU+1112 +U+1161 +U+11AB한
がU+304B +◌゙U+3099=U+304B +◌゙U+3099が
ئئU+0626يU+064A +◌ٔU+0654ئ
בּU+FB31בU+05D1 +◌ּU+05BCבּ

NFC

[modifier |modifier le code]

Les caractères sont décomposés par équivalence canonique, réordonnés, et composés par équivalence canonique.

Exemples NFC
chaînecaractères caractères
normalisés
chaîne
normalisée
AU+0041 +◌̀U+0300ÀU+00C0À
ẹ́eU+0065 +◌́U+0301 +◌̣U+0323U+1EB9 +◌́U+0301ẹ́
ññU+00F1=ñU+00F1ñ
(ohm)U+2126ΩU+03A9Ω (oméga)
fi (ligature)U+FB01=U+FB01fi (ligature)
² (exposant)²U+00B2=²U+00B2² (exposant)
U+D55C=U+D55C
がU+304B +◌゙U+3099U+304C
ئئU+0626=ئU+0626ئ
בּU+FB31בU+05D1 +◌ּU+05BCבּ

NFKD

[modifier |modifier le code]

Les caractères sont décomposés par équivalence canonique et de compatibilité, et sont réordonnés.

Exemples NFKD
chaînecaractères caractères
normalisés
chaîne
normalisée
AU+0041 +◌̀U+0300=AU+0041 +◌̀U+0300
ẹ́eU+0065 +◌́U+0301 +◌̣U+0323eU+0065 +◌̣U+0323 +◌́U+0301ẹ́
ññU+00F1nU+006E +◌̃U+0303
(ohm)U+2126ΩU+03A9Ω (oméga)
fi (ligature)U+FB01fU+0066 +iU+0069fi
² (exposant)²U+00B22U+00322
U+D55CU+1112 +U+1161 +U+11AB한
がU+304B +◌゙U+3099=U+304B +◌゙U+3099が
ئئU+0626يU+064A +◌ٔU+0654ئ
בּU+FB31בU+05D1 +◌ּU+05BCבּ

NFKC

[modifier |modifier le code]

Les caractères sont décomposés par équivalence canonique et de compatibilité, sont réordonnés et sont composés par équivalence canonique.

Exemples NFKC
chaînecaractères caractères
normalisés
chaîne
normalisée
AU+0041 +◌̀U+0300ÀU+00C0À
ẹ́eU+0065 +◌́U+0301 +◌̣U+0323U+1EB9 +◌́U+0301ẹ́
ññU+00F1=ñU+00F1ñ
(ohm)U+2126ΩU+03A9Ω (oméga)
fi (ligature)U+FB01fU+0066 +iU+0069fi
² (exposant)²U+00B22U+00322
U+D55C=U+D55C
がU+304B +◌゙U+3099U+304C
ئئU+0626=ئU+0626ئ
בּU+FB31בU+05D1 +◌ּU+05BCבּ

Annexes

[modifier |modifier le code]

Articles connexes

[modifier |modifier le code]
  • Unicode
  • Équivalence Unicode
  • L’outil uconv (ICU) permet de normaliser du texte, par exemple « uconv -x '::nfkd;' » applique la normalisation NFKD.

Liens externes

[modifier |modifier le code]
v ·m
Jeux de caractères de baseLogo d'Unicode
Codification de fichiers et protocoles
Adaptations de référence
Équivalences standards
  • NFC (forme précomposée, recommandée)
  • NFD (forme décomposée)
  • NFKC (forme précomposée de compatibilité)
  • NFKD (forme décomposée de compatibilité)
Propriétés et algorithmes
Transformations
Standards et normes liés
  • BCP 47 (étiquettes IETF d’identification de langues)
  • ISO 639 (codes pour la représentation des noms de langues ou groupes de langues)
  • ISO 15924 (codes pour la représentation des noms d’écritures)
  • ISO 3166-1 (codes pour la représentation des noms de pays ou régions du monde)
  • ISO 4217 (codes pour la représentation des noms de devises monétaires)
Mises en œuvre et applications
Ce document provient de « https://fr.wikipedia.org/w/index.php?title=Normalisation_Unicode&oldid=204245941 ».
Catégorie :
Catégories cachées :

[8]ページ先頭

©2009-2025 Movatter.jp