NormalizationForm Enumeración

Definición

Define el tipo de normalización que se va a realizar.

public enum class NormalizationForm
public enum NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm = 
[<System.Runtime.InteropServices.ComVisible(true)>]
type NormalizationForm = 
Public Enum NormalizationForm
Herencia
NormalizationForm
Atributos

Campos

Nombre Valor Description
FormC 1

Indica que una cadena Unicode se normaliza mediante la descomposición canónica completa, seguida de la sustitución de secuencias con sus compuestos principales, si es posible.

FormD 2

Indica que una cadena Unicode se normaliza mediante la descomposición canónica completa.

FormKC 5

Indica que una cadena Unicode se normaliza mediante la descomposición de compatibilidad completa, seguida de la sustitución de secuencias por sus compuestos principales, si es posible.

FormKD 6

Indica que una cadena Unicode se normaliza mediante la descomposición de compatibilidad completa.

Comentarios

Algunas secuencias Unicode se consideran equivalentes porque representan el mismo carácter. Por ejemplo, los siguientes se consideran equivalentes porque cualquiera de estos se puede usar para representar "ắ":

  • "\u1EAF" (LETRA PEQUEÑA LATINA U+1EAF A CON BREVE Y AGUDA)

  • "\u0103\u0301" (LETRA PEQUEÑA LATINA U+0103 A WITH BREVE + U+0301 COMBINING ACUTE ACCENT)

  • "\u0061\u0306\u0301" (U+0061 LATIN SMALL LETTER A + U+0306 COMBINING BREVE + U+0301 COMBINING ACUTE ACCENT)

Sin embargo, ordinal, es decir, las comparaciones binarias consideran que estas secuencias son diferentes porque contienen valores de código Unicode diferentes. Antes de realizar comparaciones ordinales, las aplicaciones deben normalizar estas cadenas para descomponerlas en sus componentes básicos.

Cada carácter Unicode compuesto se asigna a una secuencia más básica de uno o varios caracteres. El proceso de descomposición reemplaza los caracteres compuestos de una cadena por sus asignaciones más básicas. Una descomposición completa realiza de forma recursiva este reemplazo hasta que ninguno de los caracteres de la cadena se pueda descomponer más.

Unicode define dos tipos de descomposición: descomposición de compatibilidad y descomposición canónica. En la descomposición de compatibilidad, es posible que se pierda información de formato. En la descomposición canónica, que es un subconjunto de la descomposición de compatibilidad, se conserva la información de formato.

Se consideran dos conjuntos de caracteres que tienen equivalencia canónica si sus descomposición canónicas completas son idénticas. Del mismo modo, se consideran que dos conjuntos de caracteres tienen equivalencia de compatibilidad si sus descomposición de compatibilidad completa son idénticas.

Para obtener más información sobre la normalización, descomposición y equivalencia, vea Anexo estándar Unicode n.º 15: Formularios de normalización Unicode en unicode.org.

Se aplica a

Consulte también