NormalizationForm Enumeráció
Definíció
Fontos
Egyes információk olyan, kiadás előtti termékekre vonatkoznak, amelyek a kiadásig még jelentősen módosulhatnak. A Microsoft nem vállal kifejezett vagy törvényi garanciát az itt megjelenő információért.
Meghatározza a végrehajtandó normalizálás típusát.
public enum class NormalizationForm
public enum NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm =
[<System.Runtime.InteropServices.ComVisible(true)>]
type NormalizationForm =
Public Enum NormalizationForm
- Öröklődés
- Attribútumok
Mezők
| Name | Érték | Description |
|---|---|---|
| FormC | 1 | Azt jelzi, hogy egy Unicode-sztring normalizálva van teljes canonical decomposition használatával, majd a sorozatok cseréje az elsődleges kompozitokkal, ha lehetséges. |
| FormD | 2 | Azt jelzi, hogy egy Unicode-sztring normalizálva van teljes canonical decomposition használatával. |
| FormKC | 5 | Azt jelzi, hogy a Unicode-sztringek normalizálása teljes kompatibilitási felbontással történik, majd lehetőség szerint a sorozatok cseréje az elsődleges összetettekre. |
| FormKD | 6 | Azt jelzi, hogy a Unicode-sztringek normalizálása teljes kompatibilitási felbontással történik. |
Megjegyzések
Egyes Unicode-szekvenciák egyenértékűnek minősülnek, mert ugyanazt a karaktert képviselik. A következők például egyenértékűnek tekinthetők, mivel ezek bármelyike használható a "ắ" jelölésére:
"\u1EAF" (U+1EAF LATIN KIS A BETŰ BREVE ÉS AKUT)
"\u0103\u0301" (U+0103 LATIN KIS A BETŰ BREVE+U+0301 AKUT JELÖLŐSZÍN KOMBINÁLÁSÁVAL)
"\u0061\u0306\u0301" (U+0061 LATIN KIS A BETŰ + U+0306 KOMBINÁCIÓK BREVE + U+0301 EGYESÍTŐ AKUT JELÖLŐSZÍN)
Az ordinális, azaz bináris összehasonlítások azonban eltérőnek tekintik ezeket a szekvenciákat, mivel különböző Unicode-kódértékeket tartalmaznak. Az ordinális összehasonlítások végrehajtása előtt az alkalmazásoknak normalizálniuk kell ezeket a sztringeket, hogy az alapösszetevőkké bontsák őket.
Minden összetett Unicode-karakter egy vagy több karakter alapszintű sorozatára van leképezve. A felbontás folyamata egy sztring összetett karaktereit az alapszintű leképezésekre cseréli. A teljes felbontás rekurzív módon hajtja végre ezt a cserét, amíg a sztring egyik karaktere sem bontható tovább.
A Unicode két felbontástípust határoz meg: kompatibilitási felbontást és cant. A kompatibilitás felbontása esetén előfordulhat, hogy a formázási információk elvesznek. A kompatibilitási felbontás egy részhalmaza, a canonical decomposition esetében a formázási információk megmaradnak.
Két karaktercsoport akkor tekinthető canonikus egyenértékűségnek, ha a teljes canonical decompositions azonos. Hasonlóképpen, két karaktercsoport kompatibilitási egyenértékűségnek minősül, ha a teljes kompatibilitási felbontásuk azonos.
A normalizálásról, a felbontásokról és az egyenértékűségről további információt a Unicode Standard 15. mellékletében talál: Unicode Normalization Forms at unicode.org.