문자 집합

"문자 집합"은 식별 코드 값에 문자를 매핑하는 것입니다. 현재 컴퓨터에서 가장 일반적으로 사용되는 문자 집합은 문자 인코딩에 대한 글로벌 표준인 유니코드입니다. 내부적으로 Windows 애플리케이션은 유니코드의 UTF-16 구현을 사용합니다. UTF-16에서는 대부분의 문자가 2 바이트 코드로 식별됩니다. 덜 일반적으로 사용되는 보조 문자는 각각 2 바이트 코드 쌍인 서로게이트 쌍으로 표시됩니다. 자세한 내용은 서로게이트 및 보조 문자를 참조하세요.

일부 Windows 애플리케이션은 Windows Me/98/95에 기본 제공되는 이전 문자 집합으로 작동해야 합니다. Windows 코드 페이지를 사용하면 애플리케이션이 이러한 문자 집합으로 작업할 수 있습니다. 이러한 문자 집합은 다음으로 나눌 수 있습니다.

  • SBCS(싱글 바이트 문자 집합). SBCS에서 각 문자는 너비가 1 바이트인 값으로 식별됩니다.
  • 멀티 바이트 문자 집합, 특히 DBCS( 더블 바이트 문자 집합 ). 멀티 바이트 문자 집합은 많은 아시아 언어로 많은 수의 문자를 나타내는 수단을 제공합니다.

자세한 내용은 아래 항목을 참조하세요.

유니코드 및 문자 집합 정보