字碼頁編碼方式支援
更新:2007 年 11 月
由於應用程式不需再參考字碼頁,因此在 .NET Framework 中使用 Unicode 可簡化世界性的應用程式開發作業。字碼頁是特定順序的選取字元碼清單 (表示為字碼指標的字元)。字碼頁通常定義為支援特定語言或共用通用寫入系統的語言群組。
Windows 字碼頁含有 256 字碼指標,並且以零起始。在大部分的字碼頁中,0 到 127 的字碼指標表示相同的字元,以提供連續性和舊版字碼使用。字碼頁之間 128 到 255 的字碼指標則有大幅的不同。例如,字碼頁 1253 提供希臘文寫入系統必須的字元碼。字碼頁 1252 提供拉丁撰寫系統 (包括英文、德文和法文) 的字元。字碼頁 1253 中的最後 128 個字碼指標含有希臘字元,而字碼頁 1252 中的最後 128 字碼指標含有強調文字字元。因此,您的應用程式無法將希臘文和德文儲存在相同的字碼資料流 (Stream),除非它包含了表示參考字碼頁的識別項。
雙位元組字元集 (DBCS) 配置是針對具有超過 256 字元的語言而開發,例如中文、日文和韓文。在 DBCS 中,字碼指標組 (雙位元) 表示每個字元。當應用程式處理 DBCS 資料時,DBCS 字元的第一個位元 (前導位元組 (Lead Byte)) 並不會自行處理。它將與緊跟在後的隨後位元組 (Trail Byte) 一起處理。這個配置仍舊不允許在相同的資料流中使用兩種語言組合,例如日文和中文。原因是雙位元字碼指標組可根據字碼頁表示不同的字元。
.NET Framework 支援使用字碼頁的編碼字元。您的應用程式可以使用 GetEncoding 方法建立指定字碼頁的目標編碼方式物件。下列程式碼範例會建立字碼頁 1252 的編碼。
Encoding enc = Encoding.GetEncoding(1252)
Encoding enc = Encoding.GetEncoding(1252);
在應用程式建立了與指定字碼頁對應的 Encoding 物件之後,即可使用該物件來執行 Encoding 類別所支援的其他作業。如需使用這個類別的範例,請參閱使用 Unicode 編碼方式主題中的<使用 Encoding 類別>副標題。