字体使用的字符集
所有字体都使用字符集。 字符集包含标点符号、数字、大写和小写字母以及所有其他可打印字符。 字符集的每个元素都由一个数字标识。
大多数使用的字符集都是美国 ASCII 字符集的超集,它为 32 到 127 的 96 个数值定义字符。 有五个主要的字符集组:
- Windows
- Unicode
- OEM(原始设备制造商)
- 符号
- 特定于供应商
Windows 字符集
Windows 字符集是最常用的字符集。 它实质上等效于 ANSI 字符集。 空白字符是 Windows 字符集中的第一个字符。 它具有十六进制值0x20 (十进制 32) 。 Windows 字符集中的最后一个字符具有十六进制值0xFF (255) 。
许多字体指定默认字符。 每当对不在字体中的字符发出请求时,系统会提供此默认字符。 许多使用 Windows 字符集的字体将句点 (.) 指定为默认字符。 TrueType 和 OpenType 字体通常使用打开框作为默认字符。
字体使用称为四边形的断字符来分隔单词和对齐文本。 大多数使用 Windows 字符集的字体指定空白字符将用作断字符。
Unicode 字符集
Windows 字符集使用 8 位表示每个字符;因此,可以使用 8 位表示的最大字符数为 256 (2^8) 。 这通常足以满足西方语言的需求,包括法语、德语、西班牙语和其他语言中使用的音调符号。 但是,东部语言使用数千个单独的字符,无法使用单字节编码方案进行编码。 随着计算机商业的激增,开发了双字节编码方案,以便字符可以以 8 位、16 位、24 位或 32 位序列表示。 这需要复杂的传递算法:即便如此,使用不同的代码集可能会在两台不同的计算机上产生完全不同的结果。
为了解决多种编码方案的问题,开发了用于数据表示的 Unicode 标准。 Unicode 是 16 位字符编码方案,可以表示 65,536 (2^16) 字符,这足以包含当今计算机商业中的所有语言,以及标点符号、数学符号和扩展空间。 Unicode 为每个字符建立唯一的代码,以确保字符转换始终准确。
OEM 字符集
OEM 字符集通常用于用于屏幕显示的全屏 MS-DOS 会话中。 在 OEM、美国 ASCII 和 Windows 字符集中,字符 32 到 127 通常相同。 OEM 字符集中的其他字符 (0 到 31 和 128 到 255) 对应于可以在全屏 MS-DOS 会话中显示的字符。 这些字符通常与 Windows 字符不同。
符号字符集
符号字符集包含通常用于表示数学公式和科学公式的特殊字符。
特定于供应商的字符集
许多打印机和其他输出设备提供基于不同于 Windows 和 OEM 集的字符集的字体,例如,扩展二进制编码的十进制交换代码 (EBCDIC) 字符集。 若要使用这些字符集之一,打印机驱动程序将从 Windows 字符集转换为特定于供应商的字符集。