NormalizationForm Enumeráció

Definíció

Meghatározza a végrehajtandó normalizálás típusát.

public enum class NormalizationForm
public enum NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm = 
[<System.Runtime.InteropServices.ComVisible(true)>]
type NormalizationForm = 
Public Enum NormalizationForm
Öröklődés
NormalizationForm
Attribútumok

Mezők

Name Érték Description
FormC 1

Azt jelzi, hogy egy Unicode-sztring normalizálva van teljes canonical decomposition használatával, majd a sorozatok cseréje az elsődleges kompozitokkal, ha lehetséges.

FormD 2

Azt jelzi, hogy egy Unicode-sztring normalizálva van teljes canonical decomposition használatával.

FormKC 5

Azt jelzi, hogy a Unicode-sztringek normalizálása teljes kompatibilitási felbontással történik, majd lehetőség szerint a sorozatok cseréje az elsődleges összetettekre.

FormKD 6

Azt jelzi, hogy a Unicode-sztringek normalizálása teljes kompatibilitási felbontással történik.

Megjegyzések

Egyes Unicode-szekvenciák egyenértékűnek minősülnek, mert ugyanazt a karaktert képviselik. A következők például egyenértékűnek tekinthetők, mivel ezek bármelyike használható a "ắ" jelölésére:

  • "\u1EAF" (U+1EAF LATIN KIS A BETŰ BREVE ÉS AKUT)

  • "\u0103\u0301" (U+0103 LATIN KIS A BETŰ BREVE+U+0301 AKUT JELÖLŐSZÍN KOMBINÁLÁSÁVAL)

  • "\u0061\u0306\u0301" (U+0061 LATIN KIS A BETŰ + U+0306 KOMBINÁCIÓK BREVE + U+0301 EGYESÍTŐ AKUT JELÖLŐSZÍN)

Az ordinális, azaz bináris összehasonlítások azonban eltérőnek tekintik ezeket a szekvenciákat, mivel különböző Unicode-kódértékeket tartalmaznak. Az ordinális összehasonlítások végrehajtása előtt az alkalmazásoknak normalizálniuk kell ezeket a sztringeket, hogy az alapösszetevőkké bontsák őket.

Minden összetett Unicode-karakter egy vagy több karakter alapszintű sorozatára van leképezve. A felbontás folyamata egy sztring összetett karaktereit az alapszintű leképezésekre cseréli. A teljes felbontás rekurzív módon hajtja végre ezt a cserét, amíg a sztring egyik karaktere sem bontható tovább.

A Unicode két felbontástípust határoz meg: kompatibilitási felbontást és cant. A kompatibilitás felbontása esetén előfordulhat, hogy a formázási információk elvesznek. A kompatibilitási felbontás egy részhalmaza, a canonical decomposition esetében a formázási információk megmaradnak.

Két karaktercsoport akkor tekinthető canonikus egyenértékűségnek, ha a teljes canonical decompositions azonos. Hasonlóképpen, két karaktercsoport kompatibilitási egyenértékűségnek minősül, ha a teljes kompatibilitási felbontásuk azonos.

A normalizálásról, a felbontásokról és az egyenértékűségről további információt a Unicode Standard 15. mellékletében talál: Unicode Normalization Forms at unicode.org.

A következőre érvényes:

Lásd még