NormalizationForm 열거형
정의
중요
일부 정보는 릴리스되기 전에 상당 부분 수정될 수 있는 시험판 제품과 관련이 있습니다. Microsoft는 여기에 제공된 정보에 대해 어떠한 명시적이거나 묵시적인 보증도 하지 않습니다.
수행할 정규화 형식을 정의합니다.
public enum class NormalizationForm
public enum NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm =
[<System.Runtime.InteropServices.ComVisible(true)>]
type NormalizationForm =
Public Enum NormalizationForm
- 상속
- 특성
필드
FormC | 1 | 유니코드 문자열이 완전한 정식 분해를 사용하여 정규화되고, 가능한 경우 기본 복합으로 시퀀스를 대체함을 나타냅니다. |
FormD | 2 | 유니코드 문자열이 완전한 정식 분해를 사용하여 정규화됨을 나타냅니다. |
FormKC | 5 | 유니코드 문자열이 완전한 호환성 분해를 사용하여 정규화되고, 가능한 경우 기본 복합으로 시퀀스를 대체함을 나타냅니다. |
FormKD | 6 | 유니코드 문자열이 완전한 호환성 분해를 사용하여 정규화됨을 나타냅니다. |
설명
일부 유니코드 시퀀스는 동일한 문자를 나타내기 때문에 동일한 것으로 간주됩니다. 예를 들어 다음 항목은 ""을 나타내는 데 사용할 수 있으므로 동등한 것으로 간주됩니다.
"\u1EAF"(U+1EAF LATIN SMALL LETTER A WITH BREVE and ACUTE)
"\u0103\u0301"(U+0103 LATIN SMALL LETTER A WITH BREVE + U+0301 COMBINING ACUTE ACCENT)
"\u0061\u0306\u0301"(U+0061 LATIN SMALL LETTER A + U+0306 COMBINING BREVE + U+0301 COMBINING ACUTE ACCENT)
그러나 서수( 즉, 이진)는 서로 다른 유니코드 코드 값을 포함하기 때문에 이러한 시퀀스를 다르게 간주합니다. 서 수 비교를 수행 하기 전에 애플리케이션 기본 구성 요소로 분해 이러한 문자열을 정규화 해야 합니다.
각 복합 유니코드 문자는 하나 이상의 문자로 구성된 더 기본적인 시퀀스에 매핑됩니다. 분해 프로세스는 문자열의 복합 문자를 보다 기본적인 매핑으로 바꿉니다. 전체 분해는 문자열의 문자를 더 이상 분해할 수 없을 때까지 이 대체를 재귀적으로 수행합니다.
유니코드는 호환성 분해 및 정식 분해라는 두 가지 유형의 분해를 정의합니다. 호환성 분해에서 서식 정보가 손실될 수 있습니다. 호환성 분해의 하위 집합인 정식 분해에서는 서식 정보가 유지됩니다.
두 문자 집합은 전체 정식 분해가 동일한 경우 정식 동등성을 갖는 것으로 간주됩니다. 마찬가지로 전체 호환성 분해가 동일한 경우 두 문자 집합이 호환성 동등성을 갖는 것으로 간주됩니다.
정규화, 분해 및 동등성에 대한 자세한 내용은 유니코드 표준 부속서 #15: unicode.org 유니코드 정규화 양식을 참조하세요 .
적용 대상
추가 정보
.NET