EDI-Zeichensätze
BizTalk Server verwendet einen Zeichensatz, um einen gesamten EDI-Austausch zu überprüfen. Die Zeichensätze, die für eine X12-codierte Nachricht und eine EDIFACT- oder KEDIFACT-codierte Nachricht verwendet werden, werden auf verschiedene Weise ermittelt.
Ein EDIFACT-codierter Austausch ist hinsichtlich seines Zeichensatzes selbstbeschreibend. Das UNB1-Datenelement wird verwendet. EDIFACT erfordert, dass Tagnamen und Trennzeichen ASCII-Typen sind. Daher ist die Suche nach UNB1 zum Anwenden der relevanten Codepage für den restlichen Austausch möglich.
Bei der Verarbeitung einer eingehenden EDIFACT-Nachricht bestimmt BizTalk Server den Zeichensatz, der für diese Nachricht aus dem UNB1-Datenelement verwendet werden soll. Zu diesem Zweck ist keine Einstellung in der Handelspartnervereinbarung erforderlich.
Bei der Verarbeitung einer ausgehenden EDIFACT-Nachricht verwendet BizTalk Server den Zeichensatz im Handelspartnervertrag oder in der Fallbackvereinbarung. Sie legen das UNB1-Datenelement auf der Seite Zeichensatz und Trennzeichen auf den Registerkarten für bidirektionale Vereinbarungen (wenn eine Vereinbarung definiert ist) oder auf der Seite Zeichensatz und Trennzeichen auf der Registerkarte Vereinbarung des Dialogfelds EDIFACT Fallbackeinstellungen fest (wenn keine Vereinbarung definiert ist). UNB1.1 ist ein zwingend erforderliches zusammengesetztes Datenelement, das als Syntaxbezeichner bezeichnet wird. UNB1.2 ist die Version des EDIFACT-Zeichensatzes. Das UNB1-Datenelement wird außerdem zum Überprüfen der für Eigenschaften in die Handelspartnerverwaltungs-Benutzeroberfläche eingegebenen Werte verwendet, wenn der gesamte Eigenschaftensatz gespeichert wird (nicht, wenn Sie aus einem Feld wechseln oder eine andere Seite anzeigen).
Die verfügbaren Zeichensätze sind KECA, UNOA, UNOB, UNOC, UNOD, UNOE, UNOF, UNOG, UNOH, UNOI, UNOJ, UNOK, UNOX und UNOY. Der Standardwert ist UNOB. Der vollständige Zeichensatz für diese Ebenen wird in den ISO 9735 EDIFACT-Syntaxregeln definiert.
Hinweis
Wenn der UNOC-Zeichensatz in einem ein- oder ausgehenden Austausch erkannt wird, verwendet der EDI-Disassembler oder der EDI-Assembler die Codepage Latin-1 anstelle der Codepage UTF-8. Dies ist erforderlich, weil UTF-8 keine Obermenge von UNOC ist. Einige Zeichen, die in UNOC zulässig sind, bewirken, dass ein Austausch bei der Verarbeitung als UTF-8 angehalten wird.
Zeichen in einigen EDIFACT-Zeichensätzen können Doppelbyte-Zeichen sein, in anderen EDIFACT-Zeichensätzen kann es sich um Einzelbyte-Zeichen handeln. Wenn Sie die Freigabekriterien für Batches basierend auf der Anzahl der Zeichen im Austausch festlegen, kann sich daher die Anzahl der Bytes im Austausch abhängig vom verwendeten Zeichensatz unterscheiden.
Das UNA-Segment und der UNB-Segmentname sind auf die Werte im ASCII-Zeichensatz eingeschränkt.
Ebenso wie bei EDIFACT wird der Zeichensatz für einen KEDIFACT-codierten Austausch im UNB1-Datenelement eingerichtet. Bei EDIFACT wird der Zeichensatz, der von BizTalk Server bei der Verarbeitung eines KEDIFACT-Austauschs angewendet werden soll, im Datenelement UNB1 der Seite Zeichensatz und Trennzeichen auf den Registerkarten für bidirektionale Vereinbarungen (wenn eine Vereinbarung definiert ist) oder auf der Seite Charset und Trennzeichen auf der Registerkarte "Vereinbarung" des Dialogfelds EDIFACT-Fallbackeinstellungen (wenn keine Vereinbarung definiert ist) eingerichtet. Der Wert für das Identifier -Element (UNB1.1) muss auf KECA festgelegt werden.
Wenn die BizTalk-Empfangspipeline oder -Sendepipeline die EDI-Überprüfung einer X12-codierten Nachricht ausführt, wird der X12-Zeichensatz verwendet, der in der Eigenschaft CharacterSet der Pipeline ausgewählt ist. Zum Festlegen dieser Eigenschaft öffnen Sie das Dialogfeld Eigenschaften für den Empfangsspeicherort oder Sendeport, klicken auf die Auslassungszeichen neben der Empfangs- oder Sendepipeline und legen dann die Eigenschaft CharacterSet für den Disassembler oder den Assembler fest.
Die Eigenschaft CharacterSet der Pipeline wird zum Überprüfen eines X12-Austauschs verwendet, weil im Gegensatz zu EDIFACT oder KEDIFACT ein X12-codierter Austausch hinsichtlich seines Zeichensatzes nicht selbstbeschreibend ist. Wenn der ISA-Header mit ISO- oder UTF-Codierung gelesen wird, kann dies ggf. zu anderen Werten für den Verzeichnisnachschlagevorgang führen. BizTalk muss daher den anwendbaren Zeichensatz kennen, der bei der Verarbeitung der Nachricht vor dem Verzeichnisnachschlagevorgang verwendet werden soll (bei diesem Vorgang würde der anwendbare Zeichensatz für die Vereinbarung abgerufen).
Sie geben den X12-Zeichensatz an, der für die Vereinbarungsvalidierung verwendet werden soll, auf der Seite Zeichensatz und Trennzeichen auf den Registerkarten für bidirektionale Vereinbarung (wenn eine Vereinbarung definiert ist) oder auf der Seite Zeichensatz und Trennzeichen auf der Registerkarte "Fallbackvereinbarung" des Dialogfelds "X12-Fallbackeinstellungen " (wenn keine Vereinbarung definiert ist). BizTalk verwendet diese Einstellungen jedoch nur zum Überprüfen der für die verwandten Eigenschaften eingegebenen Werte, wenn der gesamte Eigenschaftensatz gespeichert wird (nicht, wenn Sie aus einem Feld wechseln oder eine andere Seite anzeigen). Die Empfangspipeline oder die Sendepipeline ignorieren diese Zeichensatzeigenschaften.
Hinweis
Wenn der in der Vereinbarung oder der Ausweichvereinbarung angegebene Zeichensatz nicht mit dem Zeichensatz übereinstimmt, der für die Empfangs- oder Sendepipeline ausgewählt wurde, sind ggf. Nachrichtenüberprüfungsfehler die Folge. Beispiel: Die X12-Zeichensatzeigenschaft in der Vereinbarung ist auf Extended festgelegt, während die X12--Zeichensatzeigenschaft in den Pipelineeigenschaften auf Basic festgelegt ist.
Die verfügbaren Zeichensätze sind Basic und Extended (wie in den X12-Spezifikationen/Implementierungshandbüchern dokumentiert) und UTF8/Unicode. Der Standardwert ist UTF8.
Hinweis
Die für das Datenelementtrennzeichen, das Komponentenelementtrennzeichen und das Segmentabschlusszeichen in der bidirektionalen Vereinbarung oder Ausweichvereinbarung eingegebenen Werte sind auf die Werte im ASCII-Zeichensatz eingeschränkt. Diese Eigenschaften werden nicht anhand des X12-Zeichensatzes überprüft.
Der Zeichensatz Basic enthält die folgenden Großbuchstaben, Ziffern, Leerzeichen und Sonderzeichen: A bis Z, 0 bis 9, ! " & ' ( ) * + , - . / : ; ? = (Leerzeichen).
Der Erweiterte Zeichensatz enthält die Zeichen im Basic-Zeichensatz sowie Kleinbuchstaben, Sprachzeichen und andere Sonderzeichen: a bis z, % @ [ ] _ { } \ | <> ~ # $.