싱글 바이트 및 멀티바이트 문자 집합

ASCII 문자 집합은 0x00 - 0x7F 범위의 문자를 정의합니다. asCII 문자 집합과 동일하게 0x7F 0x00 범위 내의 문자를 정의하고 0x80 확장 문자 집합을 정의하는 다른 많은 문자 집합(주로 유럽 문자 집합)이 0xFF. SBCS(8비트 싱글 바이트 문자 집합)는 ASCII 문자 집합과 많은 유럽 언어의 문자 집합을 나타내기에 충분합니다. 그러나 일본어 간지와 같은 일부 비유럽 문자 집합에는 싱글바이트 코딩 구성표로 나타낼 수 있는 것보다 많은 문자가 포함되므로 MBCS(멀티바이트 문자 집합) 인코딩이 필요합니다.

참고 항목

많은 Microsoft 런타임 라이브러리 SBCS 루틴은 멀티바이트 바이트, 문자 및 문자열을 적절하게 처리합니다. 많은 멀티바이트 문자 집합은 ASCII 문자 집합을 하위 집합으로 정의합니다. 많은 멀티바이트 문자 집합에서 0x00 - 0x7F 범위의 각 문자는 ASCII 문자 집합에 동일한 값을 가진 문자와 같습니다. 예를 들어 ASCII 및 MBCS 문자열 모두에서 1바이트 null 문자('\0')는 0x00 값을 가지며 종료 null 문자를 나타냅니다.

멀티바이트 문자 집합은 1바이트 문자와 2바이트 문자로 구성됩니다. 멀티바이트 문자열에는 싱글바이트 문자와 더블바이트 문자가 혼합되어 포함될 수 있습니다. 2바이트 멀티바이트 문자는 후행 바이트와 선행 바이트를 가집니다. 특정 멀티바이트 문자 집합에서 선행 바이트는 후행 바이트와 마찬가지로 특정 범위 내에 속합니다. 이러한 범위가 겹치는 경우 컨텍스트를 평가하여 지정된 바이트가 리드 바이트 또는 후행 바이트로 작동하는지 확인해야 할 수 있습니다.

참고 항목

국제화
범주별 유버니설 C 런타임 루틴