字型所使用的字元集

所有字型都會使用字元集。 字元集包含標點符號、數位、大寫和小寫字母,以及所有其他可列印字元。 字元集的每個元素都是以數位來識別。

使用中的大部分字元集都是美國 ASCII 字元集的超集合,其會定義 96 個數值的字元,從 32 到 127。 字元集有五個主要群組:

  • Windows
  • Unicode
  • OEM (原始設備製造商)
  • 符號
  • 廠商專屬

Windows 字元集

Windows 字元集是最常使用的字元集。 它基本上相當於 ANSI 字元集。 空白字元是 Windows 字元集中的第一個字元。 其十六進位值0x20 (十進位 32) 。 Windows 字元集中的最後一個字元具有十六進位值,0xFF (十進位 255) 。

許多字型會指定預設字元。 每當對不在字型中的字元提出要求時,系統就會提供這個預設字元。 許多使用 Windows 字元集的字型會將句號指定為預設字元 (.) 。 TrueType 和 OpenType 字型通常會使用開啟方塊做為預設字元。

字型會使用稱為四邊形的斷字元來分隔單字並對齊文字。 大部分使用 Windows 字元集的字型會指定空白字元會做為斷符。

Unicode 字元集

Windows 字元集會使用 8 位來代表每個字元;因此,可以使用 8 位表示的最大字元數是 256 (2^8) 。 這通常足以供西部語言使用,包括法文、德文、西班牙文和其他語言所使用的讀音符號。 不過,東部語言採用數千個不同的字元,無法使用單一位元組編碼配置進行編碼。 隨著電腦商務的激增,已開發雙位元組編碼配置,以便以 8 位、16 位、24 位或 32 位序清單示字元。 這需要複雜的傳遞演算法;即使如此,使用不同的程式碼集,可能會在兩部不同的電腦上產生完全不同的結果。

為了解決多個編碼配置的問題,已開發資料標記法的 Unicode 標準。 Unicode 可以代表 16 位字元編碼配置,可代表 65,536 (2^16) 個字元,這足以包含現今電腦商業中的所有語言,以及標點符號、數學符號和擴充空間。 Unicode 會為每個字元建立唯一的程式碼,以確保字元翻譯一律正確。

OEM 字元集

OEM 字元集通常用於螢幕顯示的全螢幕 MS-DOS 會話。 在 OEM、美國 ASCII 和 Windows 字元集中,字元 32 到 127 通常相同。 OEM 字元集中的其他字元 (0 到 31 和 128 到 255) 對應到可在全螢幕 MS-DOS 會話中顯示的字元。 這些字元通常與 Windows 字元不同。

符號字元集

符號字元集包含一般用來代表數學和科學公式的特殊字元。

廠商特定的字元集

許多印表機和其他輸出裝置會根據與 Windows 和 OEM 集合不同的字元集提供字型,例如,擴充二進位編碼十進位交換碼 (EBCDIC) 字元集。 若要使用這些字元集之一,印表機驅動程式會從 Windows 字元集轉譯為廠商特定的字元集。