Unicode- und Zeichensätze

Microsoft Windows bietet Unterstützung für die vielen verschiedenen Geschriebenen Sprachen des internationalen Marketplace über Unicode und herkömmliche Zeichensätze.

Unicode ist ein weltweiter Zeichencodierungsstandard, der eine eindeutige Zahl bereitstellt, um jedes zeichen darzustellen, das im modernen Computing verwendet wird, einschließlich technischer Symbole und Sonderzeichen, die in der Veröffentlichung verwendet werden. Unicode ist für moderne Standards wie XML und ECMAScript (JavaScript) erforderlich und ist der offizielle Mechanismus für die Implementierung von ISO/IEC 10646. Es wird von vielen Betriebssystemen, allen modernen Browsern und vielen anderen Produkten unterstützt. Neue Windows-Anwendungen sollten Unicode verwenden, um Inkonsistenzen unterschiedlicher Codeseiten zu vermeiden und die Lokalisierung zu vereinfachen.

Herkömmliche Zeichensätze sind die vorherigen Zeichencodierungsstandards– z. B. Windows-Codepages , die 8-Bit-Codewerte verwenden, oder Kombinationen von 8-Bit-Werten, um die Zeichen darzustellen, die in einer bestimmten Sprache oder geografischen Region verwendet werden.

In dieser Übersicht werden die Zeichensatzfunktionen beschrieben und erläutert, wie Sie sie in Ihren Anwendungen verwenden können.

Umgang mit internationalisierten Domänennamen (IDNs)

Verwenden der Unicode-Normalisierung zum Darstellen von Zeichenfolgen