Häufig gestellte Fragen: Benutzerdefinierter Translator

Dieser Artikel enthält Antworten auf häufig gestellte Fragen zu Custom Translator.

Welche Einschränkungen gelten derzeit für Custom Translator?

Es gibt bestimmte Einschränkungen und Grenzwerte für Dateigröße, Modelltraining und Modellimplementierung. Beachten Sie die folgenden Einschränkungen, wenn Sie das Training für die Modellerstellung in Custom Translator einrichten:

  • Übermittelte Dateien müssen kleiner als 100 MB sein.
  • Einsprachige Daten werden nicht unterstützt.

Wann sollte die Bereitstellung für ein trainiertes Übersetzungssystem angefordert werden?

Die Erstellung eines optimalen Übersetzungssystems für Ihr Projekt erfordert ggf. mehrere Trainings. Es empfiehlt sich unter Umständen, mehr Trainingsdaten oder sorgfältiger gefilterte Daten zu verwenden, wenn die BLEU-Bewertung und/oder die Testergebnisse nicht zufriedenstellend sind. Sie sollten beim Entwerfen Ihres Optimierungssatzes und Ihres Testsatzes streng und sorgfältig vorgehen. Achten Sie darauf, dass Ihre Sätze die Terminologie und den Stil des Materials, das Sie übersetzen möchten, vollständig darstellen. Bei der Erstellung Ihrer Trainingsdaten sowie bei Experimenten mit verschiedenen Optionen können Sie dagegen etwas freier agieren. Fordern Sie eine Systembereitstellung an, wenn Sie mit den Übersetzungen in den Systemtestergebnissen zufrieden sind und über keine weiteren Daten mehr verfügen, die Sie zur Verbesserung Ihres trainierten Systems hinzufügen können.

Wie viele trainierte Systeme können in einem Projekt bereitgestellt werden?

Pro Projekt kann immer nur ein einzelnes trainiertes System bereitgestellt werden. Die Erstellung eines geeigneten Übersetzungssystems für Ihr Projekt erfordert unter Umständen mehrere Trainings, und es empfiehlt sich, die Bereitstellung eines Trainings anzufordern, mit dem Sie das bestmögliche Ergebnis erzielen. Zur Beurteilung der Qualität des Trainings können Sie die BLEU-Bewertung (je höher, desto besser) heranziehen und sich mit Prüfern austauschen, bevor Sie entscheiden, ob die Übersetzungsqualität für die Bereitstellung ausreicht.

Wann kann ich mit der Bereitstellung meiner Trainings rechnen?

Die Bereitstellung dauert in der Regel weniger als eine Stunde.

Wie erfolgt der Zugriff auf ein bereitgestelltes System?

Auf bereitgestellte Systeme kann über die Microsoft-Textübersetzungs-API (V3) durch Angabe der Kategorie-ID zugegriffen werden. Weitere Informationen zur Textübersetzungs-API finden Sie auf der Webseite mit der API-Referenz.

Wie kann ich Abstimmung und Satzaufteilung überspringen, wenn die Sätze in meinen Daten bereits abgestimmt sind?

Satzabstimmung und -aufteilung werden von Custom Translator für TMX-Dateien sowie für Textdateien mit der Erweiterung .align übersprungen. Dateien mit der Erweiterung .align bieten Benutzern eine Option zum Überspringen des Satzaufteilungs- und Abstimmungsprozesses von „Benutzerdefinierter Translator“ für Dateien, die optimal abgestimmt sind und nicht weiter verarbeitet werden müssen. Es empfiehlt sich, die Erweiterung .align nur für optimal abgestimmte Dateien zu verwenden.

Sollte die Anzahl extrahierter Sätze in den beiden Dateien mit dem gleichen Basisnamen nicht übereinstimmen, führt Custom Translator die Satzabstimmung für Dateien mit der Erweiterung .align trotzdem aus.

Ich habe versucht, meine TMX-Datei hochzuladen, dabei tritt jedoch ein Dokumentverarbeitungsfehler auf.

Vergewissern Sie sich, dass die TMX-Datei den Spezifikationen für TMX 1.4b entspricht.

Nächste Schritte