다음을 통해 공유


NormalizationForm 열거형

정의

수행할 정규화 형식을 정의합니다.

public enum class NormalizationForm
public enum NormalizationForm
[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm
type NormalizationForm = 
[<System.Runtime.InteropServices.ComVisible(true)>]
type NormalizationForm = 
Public Enum NormalizationForm
상속
NormalizationForm
특성

필드

Name Description
FormC 1

유니코드 문자열이 완전한 정식 분해를 사용하여 정규화되고, 가능한 경우 기본 복합으로 시퀀스를 대체함을 나타냅니다.

FormD 2

유니코드 문자열이 완전한 정식 분해를 사용하여 정규화됨을 나타냅니다.

FormKC 5

유니코드 문자열이 완전한 호환성 분해를 사용하여 정규화되고, 가능한 경우 기본 복합으로 시퀀스를 대체함을 나타냅니다.

FormKD 6

유니코드 문자열이 완전한 호환성 분해를 사용하여 정규화됨을 나타냅니다.

설명

일부 유니코드 시퀀스는 동일한 문자를 나타내기 때문에 동일한 것으로 간주됩니다. 예를 들어 다음 항목은 ""을 나타내는 데 사용할 수 있으므로 동등한 것으로 간주됩니다.

  • "\u1EAF"(U+1EAF LATIN SMALL LETTER A WITH BREVE and ACUTE)

  • "\u0103\u0301"(U+0103 LATIN SMALL LETTER A WITH BREVE + U+0301 COMBINING ACUTE ACCENT)

  • "\u0061\u0306\u0301"(U+0061 LATIN SMALL LETTER A + U+0306 COMBINING BREVE + U+0301 COMBINING ACUTE ACCENT)

그러나 서수( 즉, 이진)는 서로 다른 유니코드 코드 값을 포함하기 때문에 이러한 시퀀스를 다르게 간주합니다. 서 수 비교를 수행 하기 전에 애플리케이션 기본 구성 요소로 분해 이러한 문자열을 정규화 해야 합니다.

각 복합 유니코드 문자는 하나 이상의 문자로 구성된 더 기본적인 시퀀스에 매핑됩니다. 분해 프로세스는 문자열의 복합 문자를 보다 기본적인 매핑으로 바꿉니다. 전체 분해는 문자열의 문자를 더 이상 분해할 수 없을 때까지 이 대체를 재귀적으로 수행합니다.

유니코드는 호환성 분해 및 정식 분해라는 두 가지 유형의 분해를 정의합니다. 호환성 분해에서 서식 정보가 손실될 수 있습니다. 호환성 분해의 하위 집합인 정식 분해에서는 서식 정보가 유지됩니다.

두 문자 집합은 전체 정식 분해가 동일한 경우 정식 동등성을 갖는 것으로 간주됩니다. 마찬가지로 전체 호환성 분해가 동일한 경우 두 문자 집합이 호환성 동등성을 갖는 것으로 간주됩니다.

정규화, 분해 및 동등성에 대한 자세한 내용은 유니코드 표준 부속서 #15: unicode.org 유니코드 정규화 양식을 참조하세요 .

적용 대상

추가 정보