Freigeben über


XML-Parser: Ungültiges Zeichen im Textinhalt gefunden

Dieser Artikel hilft Ihnen beim Beheben von Fehlern beim Analysieren von Extensible Markup Language (XML), die Sonderzeichen mithilfe des Microsoft XML-Parsers (MSXML) enthält.

Originalproduktversion: .NET Framework
Ursprüngliche KB-Nummer: 238833

Symptom

Wenn Sie XML analysieren, die Sonderzeichen mithilfe des Microsoft XML-Parsers (MSXML) enthält, kann der Parser die folgende Fehlermeldung an der Zeile und Position des ersten Sonderzeichens melden:

Ein ungültiges Zeichen wurde im Textinhalt gefunden.

Ursache

Das XML-Dokument ist nicht mit dem richtigen Zeichencodierungsschema gekennzeichnet.

Beschluss

  • Geben Sie das richtige Codierungsschema in der XML-Verarbeitungsanweisung an.
  • Codieren Sie die XML-Daten erneut als richtige UTF-8.

Der Status

Dieses Verhalten ist beabsichtigt.

Mehr Informationen

Sonderzeichen bezieht sich auf ein beliebiges Zeichen außerhalb des Standard-American Standard Code for Information Interchange (ASCII)-Zeichensatzes von 0x00 - 0x7F, z. B. lateinische Zeichen mit Akzenten, Umlauten oder anderen diakritischen Zeichen. Das Standardcodierungsschema für XML-Dokumente ist UTF-8, das ASCII-Zeichen mit einem Wert von 0x80 oder höher anders codiert als andere Standardcodierungsschemas.

Meistens sehen Sie dieses Problem, wenn Sie mit Daten arbeiten, die das einfache Iso-8859-1-Codierungsschema verwenden. In diesem Fall ist die schnellste Lösung in der Regel die erste, die im Abschnitt "Lösung " aufgeführt ist. Verwenden Sie beispielsweise die folgende XML-Deklaration:

<?xml version="1.0" encoding="iso-8859-1" ?>
<rootelement>
    ...XML data...
</rootelement>

Stattdessen können Sie jedes dieser Zeichen mithilfe des numerischen Entitätsverweises codieren. Sie können z. B. das Sonderzeichen á verwenden( <test> &#225;</test> Dezimalversion) oder <test>&#x00E1;</test> (Hexadezimalversion).