字型所使用的字元集

2025-03-12

所有字型都會使用字元集。字元集包含標點符號、數位、大寫和小寫字母，以及所有其他可列印字元。字元集的每個元素都會以數位來識別。

使用中的大部分字元集都是美國 ASCII 字元集的超集，其會定義 32 到 127 的 96 個數值的字元。字元集有五個主要群組：

窗戶
Unicode
OEM（原始裝置製造商）
象徵
廠商特定

Windows 字元集

Windows 字元集是最常用的字元集。它基本上相當於 ANSI 字元集。空白字元是 Windows 字元集中的第一個字元。其十六進位值為 0x20 （十進位 32）。 Windows 字元集中的最後一個字元具有0xFF十六進位值（十進位 255）。

許多字型會指定預設字元。每當對不在字型中的字元提出要求時，系統就會提供這個預設字元。許多使用 Windows 字元集的字型會將句號（.）指定為預設字元。 TrueType 和 OpenType 字型通常會使用開啟方塊作為預設字元。

字型會使用稱為四邊形的斷字元來分隔單字和對齊文字。大部分使用 Windows 字元集的字型都會指定空白字元做為斷字元。

Unicode 字元集

Windows 字元集會使用 8 位來代表每個字元;因此，可以使用 8 位表示的最大字元數是 256 （2^8）。這通常足以供西方語言使用，包括法文、德文、西班牙文和其他語言所使用的變音符號。不過，東方語言採用數千個不同的字元，無法使用單一位元組編碼配置進行編碼。隨著計算機商業的激增，已開發雙位元組編碼配置，以便以8位、16位、24位或32位序列來表示字元。這需要複雜的傳遞演算法;即便如此，使用不同的程式代碼集，可能會在兩部不同的計算機上產生完全不同的結果。

為了解決多個編碼配置的問題，已開發數據表示法的 Unicode 標準。 16 位字元編碼配置，Unicode 可以代表 65,536 （2^16）個字元，這足以包含現今計算機商務中的所有語言，以及標點符號、數學符號和擴充空間。 Unicode 會為每個字元建立唯一的程式代碼，以確保字元翻譯一律正確無誤。

OEM 字元集

OEM 字元集通常用於全螢幕 MS-DOS 工作階段中，以進行屏幕顯示。在 OEM、美國 ASCII 和 Windows 字元集中，字元 32 到 127 通常相同。 OEM 字元集中的其他字元（0 到 31 和 128 到 255）對應到可以在全螢幕 MS-DOS 工作階段中顯示的字元。這些字元通常與 Windows 字元不同。

符號字元集

符號字元集包含一般用來表示數學和科學公式的特殊字元。

廠商特定的字元集

許多印表機和其他輸出裝置會根據與 Windows 和 OEM 集合不同的字元集提供字型，例如擴充二進位編碼十進位交換碼（EBCDIC）字元集。若要使用這些字元集的其中一個，印表機驅動程式會從Windows字元集轉譯為廠商特定的字元集。