NormalizationForm 열거형

정의

중요

일부 정보는 릴리스되기 전에 상당 부분 수정될 수 있는 시험판 제품과 관련이 있습니다. Microsoft는 여기에 제공된 정보에 대해 어떠한 명시적이거나 묵시적인 보증도 하지 않습니다.

수행할 정규화 형식을 정의합니다.

public enum class NormalizationForm

public enum NormalizationForm

[System.Runtime.InteropServices.ComVisible(true)]
public enum NormalizationForm

type NormalizationForm =

[<System.Runtime.InteropServices.ComVisible(true)>]
type NormalizationForm =

Public Enum NormalizationForm

Name	값	Description
FormC	1	유니코드 문자열이 완전한 정식 분해를 사용하여 정규화되고, 가능한 경우 기본 복합으로 시퀀스를 대체함을 나타냅니다.
FormD	2	유니코드 문자열이 완전한 정식 분해를 사용하여 정규화됨을 나타냅니다.
FormKC	5	유니코드 문자열이 완전한 호환성 분해를 사용하여 정규화되고, 가능한 경우 기본 복합으로 시퀀스를 대체함을 나타냅니다.
FormKD	6	유니코드 문자열이 완전한 호환성 분해를 사용하여 정규화됨을 나타냅니다.

일부 유니코드 시퀀스는 동일한 문자를 나타내기 때문에 동일한 것으로 간주됩니다. 예를 들어 다음 항목은 ""을 나타내는 데 사용할 수 있으므로 동등한 것으로 간주됩니다.

"\u1EAF"(U+1EAF LATIN SMALL LETTER A WITH BREVE and ACUTE)
"\u0103\u0301"(U+0103 LATIN SMALL LETTER A WITH BREVE + U+0301 COMBINING ACUTE ACCENT)
"\u0061\u0306\u0301"(U+0061 LATIN SMALL LETTER A + U+0306 COMBINING BREVE + U+0301 COMBINING ACUTE ACCENT)

그러나 서수( 즉, 이진)는 서로 다른 유니코드 코드 값을 포함하기 때문에 이러한 시퀀스를 다르게 간주합니다. 서 수 비교를 수행 하기 전에 애플리케이션 기본 구성 요소로 분해 이러한 문자열을 정규화 해야 합니다.

각 복합 유니코드 문자는 하나 이상의 문자로 구성된 더 기본적인 시퀀스에 매핑됩니다. 분해 프로세스는 문자열의 복합 문자를 보다 기본적인 매핑으로 바꿉니다. 전체 분해는 문자열의 문자를 더 이상 분해할 수 없을 때까지 이 대체를 재귀적으로 수행합니다.

유니코드는 호환성 분해 및 정식 분해라는 두 가지 유형의 분해를 정의합니다. 호환성 분해에서 서식 정보가 손실될 수 있습니다. 호환성 분해의 하위 집합인 정식 분해에서는 서식 정보가 유지됩니다.

두 문자 집합은 전체 정식 분해가 동일한 경우 정식 동등성을 갖는 것으로 간주됩니다. 마찬가지로 전체 호환성 분해가 동일한 경우 두 문자 집합이 호환성 동등성을 갖는 것으로 간주됩니다.

이 페이지가 도움이 되었나요?