NormalizationForm Enumeración
Definición
Importante
Parte de la información hace referencia a la versión preliminar del producto, que puede haberse modificado sustancialmente antes de lanzar la versión definitiva. Microsoft no otorga ninguna garantía, explícita o implícita, con respecto a la información proporcionada aquí.
Define el tipo de normalización a realizar.
public enum class NormalizationForm
public enum NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm =
[<System.Runtime.InteropServices.ComVisible(true)>]
type NormalizationForm =
Public Enum NormalizationForm
- Herencia
- Atributos
Campos
FormC | 1 | Indica que una cadena Unicode se normaliza mediante descomposición canónica completa, seguida de la sustitución de secuencias por sus compuestos principales, si es posible. |
FormD | 2 | Indica que una cadena Unicode se normaliza mediante descomposición canónica completa. |
FormKC | 5 | Indica que una cadena Unicode se normaliza mediante descomposición de compatibilidad completa, seguida de la sustitución de secuencias por sus compuestos principales, si es posible. |
FormKD | 6 | Indica que una cadena Unicode se normaliza mediante descomposición de compatibilidad completa. |
Comentarios
Algunas secuencias Unicode se consideran equivalentes porque representan el mismo carácter. Por ejemplo, lo siguiente se considera equivalente porque cualquiera de estos se puede usar para representar "ắ":
"\u1EAF" (LETRA LATINA U+1EAF A CON BREVE Y AGUDA)
"\u0103\u0301" (LETRA PEQUEÑA LATINA U+0103 A CON BREVE + U+0301 COMBINANDO ACENTO AGUDO)
"\u0061\u0306\u0301" (LETRA PEQUEÑA LATINA U+0061 A + U+0306 COMBINANDO BREVE + U+0301 COMBINANDO ACENTO AGUDO)
Sin embargo, ordinal, es decir, las comparaciones binarias tienen en cuenta estas secuencias diferentes porque contienen valores de código Unicode diferentes. Antes de realizar comparaciones ordinales, las aplicaciones deben normalizar estas cadenas para descomponerlas en sus componentes básicos.
Cada carácter Unicode compuesto se asigna a una secuencia más básica de uno o varios caracteres. El proceso de descomposición reemplaza los caracteres compuestos de una cadena por sus asignaciones más básicas. Una descomposición completa realiza de forma recursiva este reemplazo hasta que ninguno de los caracteres de la cadena se pueda descomponer aún más.
Unicode define dos tipos de descomposición: descomposición de compatibilidad y descomposición canónica. En la descomposición de compatibilidad, es posible que se pierda la información de formato. En la descomposición canónica, que es un subconjunto de la descomposición de compatibilidad, se conserva la información de formato.
Se considera que dos conjuntos de caracteres tienen equivalencia canónica si sus descomposición canónicas completas son idénticas. Del mismo modo, se considera que dos conjuntos de caracteres tienen equivalencia de compatibilidad si sus descomposicións de compatibilidad completas son idénticas.
Para obtener más información sobre la normalización, descomposición y equivalencia, vea Anexo estándar unicode n.º 15: Formularios de normalización Unicode en unicode.org.