Mehrbyte- und Breitzeichen
Ein Mehrbytezeichen ist ein Zeichen, das aus einem oder mehreren Bytesequenzen besteht. Jede Bytesequenz stellt ein einzelnes Zeichen im erweiterten Zeichensatz dar. Mehrbytezeichen werden in Zeichensätzen wie Kanji verwendet.
Breitzeichen sind mehrsprachige Zeichencodes, deren Breite immer 16 Bit beträgt. Der Typ für Zeichenkonstanten ist char
. Der Typ ist für Breitzeichen ist wchar_t
. Da Breitzeichen stets eine feste Größe aufweisen, vereinfachen diese das Programmieren mit internationalen Zeichensätzen.
Das Breitzeichen-Zeichenfolgenliteral L"hello"
wird zu einem Array mit sechs Ganzzahlen vom Typ wchar_t
.
{L'h', L'e', L'l', L'l', L'o', 0}
Die Unicode-Spezifikation entspricht der Spezifikation für Breitzeichen. Die Laufzeitbibliotheksroutinen für Übersetzungen zwischen Multibyte- und Breitzeichen enthalten mbstowcs
, mbtowc
, wcstombs
und wctomb
.