Partager via


Prise en charge du codage pour les pages de codes

Mise à jour : novembre 2007

L'utilisation du système Unicode dans le .NET Framework simplifie le développement des applications mondialisables parce que les applications n'ont plus besoin de référencer une page de codes. Une page de codes est une liste de codes de caractères sélectionnés (caractères représentés comme des points de code) dans un certain ordre. Les pages de code sont généralement définies pour prendre en charge des langues ou des groupes de langues spécifiques qui partagent des systèmes d'écritures communs.

Les pages de codes Windows contiennent 256 points de code allant de 0 à 255. Dans la plupart des pages de codes, les points de code de 0 à 127 représentent les mêmes caractères, ceci permet d'assurer une certaine continuité et une compatibilité avec le code hérité. Par contre, les points de code de 128 à 255 diffèrent nettement d'une page de codes à l'autre. Par exemple, la page de codes 1253 fournit des codes de caractère requis par le système d'écriture grec. La page de codes 1252 fournit les caractères pour les systèmes d'écriture latins, y compris l'Anglais, l'Allemand et le Français. Les 128 derniers points de code dans la page de codes 1253 contiennent les caractères grecs, et les 128 points de code dans la page de codes 1252 contiennent les caractères accentués. Il en résulte que vos applications ne peuvent pas stocker le grec et l'allemand dans le même flux de code, sauf si elles incluent un identificateur qui précise la page de codes référencée.

Les jeux de caractères codés sur deux octets (DBCS, Double-Byte Character Sets) ont été mis au point pour des langues comme le Chinois, le Japonais et le Coréen, qui contiennent plus de 256 caractères. Dans les jeux de caractères DBCS, une paire de points de code (un double octet) représente chaque caractère. Lors du traitement des données DBCS, le premier octet d'un caractère DBCS (l'octet de tête) n'est pas traité en lui-même. Il est traité en combinaison avec l'octet de queue qui le suit immédiatement. Cette méthode ne permet pas encore la combinaison de deux langues, telles que le Japonais et le Chinois, dans le même flux de données. En effet, cette une paire de points de code de double octet peut représenter des caractères différents, selon la page de codes.

Le .NET Framework assure une prise en charge pour les caractères codés à l'aide de pages de codes. Votre application peut utiliser la méthode GetEncoding pour créer un objet de codage cible pour une page de codes spécifiée. L'exemple de code suivant crée un objet de codage Encoding pour la page de codes 1252.

Encoding enc = Encoding.GetEncoding(1252)
Encoding enc = Encoding.GetEncoding(1252);

Après avoir créé un objet de codage Encoding qui correspond à une page de codes spécifiée, votre application peut l'utiliser pour effectuer d'autres opérations prises en charge par la classe Encoding. Pour obtenir un exemple de l'utilisation de cette classe, consultez la sous-rubrique « Utilisation de la classe Encoding » de la rubrique Utilisation du codage Unicode.

Voir aussi

Concepts

Unicode dans le .NET Framework