NormalizationForm Énumération

Définition

Espace de noms:: System.Text

Assemblys:: mscorlib.dll, System.Globalization.Extensions.dll

Assembly:: mscorlib.dll

Assembly:: netstandard.dll

Important

Certaines informations portent sur la préversion du produit qui est susceptible d’être en grande partie modifiée avant sa publication. Microsoft exclut toute garantie, expresse ou implicite, concernant les informations fournies ici.

Définit le type de normalisation à effectuer.

public enum class NormalizationForm

public enum NormalizationForm

[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm

type NormalizationForm =

[<System.Runtime.InteropServices.ComVisible(true)>]
type NormalizationForm =

Public Enum NormalizationForm

Héritage: Object

ValueType

Enum
NormalizationForm

Attributs: ComVisibleAttribute

Champs

Nom	Valeur	Description
FormC	1	Indique qu’une chaîne Unicode est normalisée à l’aide de la décomposition canonique complète, suivie du remplacement des séquences par leurs composites principaux, si possible.
FormD	2	Indique qu’une chaîne Unicode est normalisée à l’aide de la décomposition canonique complète.
FormKC	5	Indique qu’une chaîne Unicode est normalisée à l’aide de la décomposition de compatibilité complète, suivie du remplacement des séquences par leurs composites principaux, si possible.
FormKD	6	Indique qu’une chaîne Unicode est normalisée à l’aide de la décomposition complète de compatibilité.

Remarques

Certaines séquences Unicode sont considérées comme équivalentes, car elles représentent le même caractère. Par exemple, les éléments suivants sont considérés comme équivalents, car l’un de ces éléments peut être utilisé pour représenter « ắ » :

«\u1EAF" (LETTRE MINUSCULE LATINE U+1EAF A AVEC BREVE ET AIGU)
«\u0103\u0301" (U+0103 LETTRE MINUSCULE LATINE A AVEC BREVE + U+0301 COMBINANT ACCENT AIGU)
«\u0061\u0306\u0301" (U+0061 LETTRE MINUSCULE LATINE A + U+0306 COMBINANT BREVE + U+0301 COMBINANT ACCENT AIGU)

Toutefois, l’ordinal, autrement dit, les comparaisons binaires considèrent ces séquences différentes, car elles contiennent différentes valeurs de code Unicode. Avant d’effectuer des comparaisons ordinales, les applications doivent normaliser ces chaînes pour les décomposer en leurs composants de base.

Chaque caractère Unicode composite est mappé à une séquence de base d’un ou plusieurs caractères. Le processus de décomposition remplace les caractères composites d’une chaîne par leurs mappages de base. Une décomposition complète effectue ce remplacement de manière récursive jusqu’à ce qu’aucun des caractères de la chaîne ne puisse être décomposé plus loin.

Unicode définit deux types de décompositions : la décomposition de compatibilité et la décomposition canonique. Dans la décomposition de compatibilité, les informations de mise en forme peuvent être perdues. Dans la décomposition canonique, qui est un sous-ensemble de décomposition de compatibilité, les informations de mise en forme sont conservées.

Deux ensembles de caractères sont considérés comme ayant une équivalence canonique si leurs décompositions canoniques complètes sont identiques. De même, deux ensembles de caractères sont considérés comme ayant une équivalence de compatibilité si leurs décompositions de compatibilité complètes sont identiques.

Pour plus d’informations sur la normalisation, les décompositions et l’équivalence, consultez l’annexe standard Unicode #15 : Formulaires de normalisation Unicode à unicode.org.

S’applique à

Voir aussi

Commentaires

Cette page a-t-elle été utile ?