Condividi tramite


NormalizationForm Enumerazione

Definizione

Definisce il tipo di normalizzazione da eseguire.

public enum class NormalizationForm
public enum NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm = 
[<System.Runtime.InteropServices.ComVisible(true)>]
type NormalizationForm = 
Public Enum NormalizationForm
Ereditarietà
NormalizationForm
Attributi

Campi

Nome Valore Descrizione
FormC 1

Indica che una stringa Unicode viene normalizzata mediante una scomposizione canonica completa, seguita dalla sostituzione delle sequenze con i relativi componenti primari, se possibile.

FormD 2

Indica che una stringa Unicode viene normalizzata mediante una scomposizione canonica completa.

FormKC 5

Indica che una stringa Unicode viene normalizzata mediante una scomposizione di compatibilità completa, seguita dalla sostituzione delle sequenze con i relativi componenti primari, se possibile.

FormKD 6

Indica che una stringa Unicode viene normalizzata mediante una scomposizione di compatibilità completa.

Commenti

Alcune sequenze Unicode sono considerate equivalenti perché rappresentano lo stesso carattere. Ad esempio, i seguenti sono considerati equivalenti perché uno di questi può essere usato per rappresentare "ắ":

  • "\u1EAF" (U+1EAF LATIN SMALL LETTER A WITH BREVE E ACUTE)

  • "\u0103\u0301" (U+0103 LATIN SMALL LETTER A WITH BREVE + U+0301 COMBINANDO ACCENTO ACUTO)

  • "\u0061\u0306\u0301" (U+0061 LETTERA PICCOLA LATINA A + U+0306 COMBINAZIONE BREVE + U+0301 COMBINAZIONE DI ACCENTO ACUTO)

Tuttavia, ordinale, ovvero binario, i confronti considerano queste sequenze diverse perché contengono valori di codice Unicode diversi. Prima di eseguire confronti ordinali, le applicazioni devono normalizzare queste stringhe per decomporle nei relativi componenti di base.

Ogni carattere Unicode composito viene mappato a una sequenza più di base di uno o più caratteri. Il processo di scomposizione sostituisce i caratteri compositi in una stringa con i mapping più di base. Una scomposizione completa esegue in modo ricorsivo questa sostituzione fino a quando nessuno dei caratteri nella stringa può essere decomposto ulteriormente.

Unicode definisce due tipi di scomposizione: scomposizione della compatibilità e scomposizione canonica. Nella scomposizione della compatibilità, le informazioni di formattazione potrebbero essere perse. Nella scomposizione canonica, ovvero un subset di scomposizione della compatibilità, le informazioni di formattazione vengono mantenute.

Due set di caratteri sono considerati equivalenti canonici se le loro scomposizione canoniche complete sono identiche. Analogamente, due set di caratteri vengono considerati equivalenti alla compatibilità se la loro scomposizione completa di compatibilità è identica.

Per altre informazioni sulla normalizzazione, la scomposizione e l'equivalenza, vedere Unicode Standard Annex #15: Unicode Normalization Forms in unicode.org.

Si applica a

Vedi anche