單位元組和多位元組字元集

ASCII 字元集定義 0x00 - 0x7F 範圍內的字元。 還有其他許多字元集,主要是歐洲字元集,定義範圍中的字元0x00 - 0x7F與 ASCII 字元集相同,也定義0x80 - 0xFF的擴充字元集。 8 位的單一位元組字元集 (SBCS) 足以代表許多歐洲語言的 ASCII 字元集和字元集。 不過,某些非歐洲字元集,例如日文漢字,包含比可以在單一位元組編碼配置中代表的字元多得多,因此需要多位元組字元集 (MBCS) 編碼。

注意

許多 Microsoft 執行時間程式庫 SBCS 常式會適當地處理多位元組位元組、字元和字串。 許多多位元組字元集都會將 ASCII 字元集定義為子集。 在許多多位元組字元集中,0x00 - 0x7F 範圍中的每個字元都會與 ASCII 字元集中具有相同值的字元相同。 例如,在 ASCII 和 MBCS 字元字串中,單位元組 Null 字元 ('\0') 會有值 0x00,並指出終止的 Null 字元。

多位元組字元集可以包含 1 位元組和 2 位元組字元。 多位元組字元字串可以包含單一位元組和雙位元組字元的混合。 雙位元組多位元組字元會有一個前導位元組和一個後隨位元組。 在特定多位元組字元集中,前導位元組落在特定範圍內,後隨位元組也是如此。 當這些範圍重迭時,您可能需要評估內容,以判斷指定的位元組是否做為前置位元組或尾端位元組。

另請參閱

國際化
依類別排序的通用 C 執行階段常式