Multioctets et caractères larges
Un caractère multioctet est un caractère composé de séquences d'un ou plusieurs octets. Chaque séquence d'octets représente un caractère unique dans le jeu de caractères étendu. Les caractères multioctets sont utilisés dans les jeux de caractères tels que Kanji.
Les caractères larges sont des codes de caractères multilingues qui ont toujours une largeur de 16 bits. Le type des constantes caractères est char
. Pour les caractères larges, le type est wchar_t
. Comme les caractères larges ont toujours une taille fixe, leur utilisation simplifie la programmation avec les jeux de caractères internationaux.
Le littéral de chaîne à caractères larges L"hello"
devient un tableau de six entiers de type wchar_t
.
{L'h', L'e', L'l', L'l', L'o', 0}
La spécification Unicode régit les caractères larges. Les routines de bibliothèque Runtime permettant de traduire des caractères multioctets et larges incluent mbstowcs
, mbtowc
, wcstombs
et wctomb
.