NormalizationForm Énumération

Définition

Définit le type de normalisation à effectuer.

public enum class NormalizationForm
public enum NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm = 
[<System.Runtime.InteropServices.ComVisible(true)>]
type NormalizationForm = 
Public Enum NormalizationForm
Héritage
NormalizationForm
Attributs

Champs

FormC 1

Indique qu’une chaîne Unicode est normalisée à l’aide de la décomposition canonique complète, suivie du remplacement des séquences par leurs composites principaux, si possible.

FormD 2

Indique qu’une chaîne Unicode est normalisée à l’aide de la décomposition canonique complète.

FormKC 5

Indique qu’une chaîne Unicode est normalisée à l’aide de la décomposition de compatibilité complète, suivie du remplacement des séquences par leurs composites principaux, si possible.

FormKD 6

Indique qu’une chaîne Unicode est normalisée à l’aide de la décomposition de compatibilité complète.

Remarques

Certaines séquences Unicode sont considérées comme équivalentes, car elles représentent le même caractère. Par exemple, les éléments suivants sont considérés comme équivalents, car l’un de ces éléments peut être utilisé pour représenter « ắ » :

  • « \u1EAF »

  • « \u0103\u0301 »

  • « \u0061\u0306\u0301 »

Toutefois, l’ordinal, autrement dit, les comparaisons binaires considèrent ces séquences différentes, car elles contiennent des valeurs de code Unicode différentes. Avant d’effectuer des comparaisons ordinales, les applications doivent normaliser ces chaînes pour les décomposer en leurs composants de base.

Chaque caractère Unicode composite est mappé à une séquence de base d’un ou plusieurs caractères. Le processus de décomposition remplace les caractères composites d’une chaîne par leurs mappages de base. Une décomposition complète effectue ce remplacement de manière récursive jusqu’à ce qu’aucun des caractères de la chaîne ne puisse être décomposé plus loin.

Unicode définit deux types de décompositions : la décomposition de compatibilité et la décomposition canonique. Dans la décomposition de compatibilité, la mise en forme des informations peut être perdue. Dans la décomposition canonique, qui est un sous-ensemble de décomposition de compatibilité, les informations de mise en forme sont conservées.

Deux ensembles de caractères sont considérés comme ayant une équivalence canonique si leurs décompositions canoniques complètes sont identiques. De même, deux ensembles de caractères sont considérés comme ayant une équivalence de compatibilité si leurs décompositions de compatibilité complètes sont identiques.

Pour plus d’informations sur la normalisation, les décompositions et l’équivalence, consultez l’annexe standard Unicode #15 : formulaires de normalisation Unicode à unicode.org.

S’applique à

Voir aussi