Zeichensätze in C++

Artikel
09/02/2008

Aktualisiert: November 2007

Ein wichtiger Aspekt bei der Entwicklung von Anwendungen für internationale Märkte ist die korrekte Darstellung lokaler Zeichensätze. Mit dem ASCII-Zeichensatz werden Zeichen im Bereich zwischen 0 x 00 und 0 x 7 F definiert. Von anderen Zeichensätzen (hauptsächlich europäischer Herkunft) werden wie beim ASCII-Zeichensatz die Zeichen innerhalb des Bereichs von 0 x 00 bis 0 x 7 F definiert; zusätzlich wird ein erweiterter Zeichensatz im Bereich von 0 x 80 bis 0 x FF definiert. Daher ist ein Einzelbyte-Zeichensatz (Single-Byte Character Set, SBCS) mit 8 Bits ausreichend, um den ASCII-Zeichensatz sowie viele andere Zeichensätze für europäische Sprachen darzustellen. Einige außereuropäische Zeichensätze, z. B. das japanische Kanji, enthalten jedoch so viele Zeichen, dass sie nicht mehr in Einzelbytecodierung dargestellt werden können. Sie müssen daher mit einem Mehrbyte-Zeichensatz (Multibyte Character Set, MBCS) codiert werden.

In diesem Abschnitt

Unicode und MBCS
Beschreibt die Visual C++-Unterstützung für Unicode und MBCS-Programmierung.
Unterstützung für Unicode
Beschreibt Unicode, eine Spezifikation zur Unterstützung sämtlicher Zeichensätze, einschließlich Zeichensätzen, zu deren Darstellung mehr als ein Byte erforderlich ist.
Unterstützung von Mehrbyte-Zeichensätzen (MBCS) in Visual C++
Beschreibt MBCS, eine Alternative zu Unicode für die Unterstützung von Zeichensätzen, die nicht mit einem Byte pro Zeichen dargestellt werden können, z. B. Japanisch und Chinesisch.
Zuordnungen für generischen Text in Tchar.h
Enthält Microsoft-spezifische Zuordnungen für generischen Text für viele Datentypen, Routinen und andere Objekte.
Gewusst wie: Konvertieren zwischen verschiedenen Zeichenfolgentypen
Veranschaulicht, wie verschiedene Visual C++-Zeichenfolgentypen in andere Zeichenfolgen konvertiert werden.

Freigeben über

Zeichensätze in C++

In diesem Abschnitt

Verwandte Abschnitte

Zusätzliche Ressourcen