글꼴에 사용되는 문자 집합

2025-03-12

모든 글꼴은 문자 집합을 사용합니다. 문자 집합에는 문장 부호, 숫자, 대문자 및 소문자 및 기타 모든 인쇄 가능한 문자가 포함됩니다. 문자 집합의 각 요소는 숫자로 식별됩니다.

사용 중인 대부분의 문자 집합은 32에서 127까지의 96개 숫자 값에 대한 문자를 정의하는 미국 ASCII 문자 집합의 상위 집합입니다. 문자 집합에는 5개의 주요 그룹이 있습니다.

Windows
유니코드
OEM(원래 장비 제조업체)
상징
공급업체별

Windows 문자 집합

Windows 문자 집합은 가장 일반적으로 사용되는 문자 집합입니다. 기본적으로 ANSI 문자 집합과 동일합니다. 빈 문자는 Windows 문자 집합의 첫 번째 문자입니다. 16진수 값은 0x20(10진수 32)입니다. Windows 문자 집합의 마지막 문자는 16진수 값인 0xFF(10진수 255)입니다.

대부분의 글꼴은 기본 문자를 지정합니다. 글꼴에 없는 문자에 대한 요청이 있을 때마다 시스템에서 이 기본 문자를 제공합니다. Windows 문자 집합을 사용하는 많은 글꼴은 마침표(.)를 기본 문자로 지정합니다. TrueType 및 OpenType 글꼴은 일반적으로 열린 상자를 기본 문자로 사용합니다.

글꼴은 쿼드라는 나누기 문자를 사용하여 단어를 구분하고 텍스트를 정당화합니다. Windows 문자 집합을 사용하는 대부분의 글꼴은 빈 문자가 중단 문자로 사용되도록 지정합니다.

유니코드 문자 집합

Windows 문자 집합은 8비트에서 각 문자를 나타냅니다. 따라서 8비트로 표현할 수 있는 최대 문자 수는 256(2^8)입니다. 일반적으로 프랑스어, 독일어, 스페인어 및 기타 언어로 사용되는 광신도 표시를 포함하여 서양 언어에 충분합니다. 그러나 동부 언어는 싱글 바이트 코딩 체계를 사용하여 인코딩할 수 없는 수천 개의 개별 문자를 사용합니다. 컴퓨터 상거래가 확산하면서 8비트, 16비트, 24비트 또는 32비트 시퀀스로 문자를 나타낼 수 있도록 더블 바이트 코딩 체계가 개발되었습니다. 이렇게 하려면 복잡한 전달 알고리즘이 필요합니다. 그럼에도 불구하고 다른 코드 집합을 사용하면 서로 다른 두 컴퓨터에서 완전히 다른 결과를 얻을 수 있습니다.

여러 코딩 체계의 문제를 해결하기 위해 데이터 표현을 위한 유니코드 표준이 개발되었습니다. 16비트 문자 코딩 체계인 유니코드는 65,536자(2^16)를 나타낼 수 있으며, 이는 오늘날 컴퓨터 상거래의 모든 언어와 문장 부호, 수학 기호 및 확장 공간을 포함하기에 충분합니다. 유니코드는 문자 변환이 항상 정확한지 확인하기 위해 모든 문자에 대해 고유한 코드를 설정합니다.

OEM 문자 집합

OEM 문자 집합은 일반적으로 화면 표시를 위해 전체 화면 MS-DOS 세션에서 사용됩니다. 32~127자의 문자는 일반적으로 OEM, 미국 ASCII 및 Windows 문자 집합에서 동일합니다. OEM 문자 집합의 다른 문자(0~31 및 128~255)는 전체 화면 MS-DOS 세션에 표시할 수 있는 문자에 해당합니다. 이러한 문자는 일반적으로 Windows 문자와 다릅니다.

기호 문자 집합

기호 문자 집합에는 일반적으로 수학 및 과학적 수식을 나타내는 데 사용되는 특수 문자가 포함되어 있습니다.

공급업체별 문자 집합

많은 프린터 및 기타 출력 장치는 Windows 및 OEM setsfor 예제와 다른 문자 집합(EBCDIC(Extended Binary Coded Decimal Interchange Code) 문자 집합)을 기반으로 글꼴을 제공합니다. 이러한 문자 집합 중 하나를 사용하려면 프린터 드라이버가 Windows 문자 집합에서 공급업체별 문자 집합으로 변환됩니다.