Freigeben über


Bereitstellen eines benutzerseitig verwalteten Glossars

Azure KI Übersetzer-Container ermöglichen eine Ausführung verschiedener Features des Translator-Diensts in Ihrer eigenen Umgebung und eignen sich hervorragend für spezifische Anforderungen bezüglich Sicherheit und Datengovernance.

Es kann vorkommen, dass Sie einen Container mit einem mehrschichtigen Erfassungsprozess ausführen und feststellen, dass Sie ein Update für Satz- und/oder Ausdrucksdateien implementieren müssen. Da die Standardausdrucks- und -satzdateien zur Laufzeit verschlüsselt und direkt in den Arbeitsspeicher eingelesen werden, müssen Sie eine schnelle Lösung für die Entwicklung implementieren, um ein dynamisches Update zu implementieren. Dieses Update kann mithilfe des Features für benutzerseitig verwaltete Glossare implementiert werden:

  • Um die phrasefix-Lösung bereitzustellen, müssen Sie eine phrasefix-Glossardatei erstellen, um anzugeben, dass ein aufgelisteter Ausdruck auf eine bestimmte Weise übersetzt wird.

  • Um die sentfix-Lösung bereitzustellen, müssen Sie eine sentfix-Glossardatei erstellen, um eine genaue Zielübersetzung für einen Quellsatz anzugeben.

  • Die phrasefix- und sentfix-Dateien werden dann in Ihre Übersetzungsanforderung aufgenommen und zur Laufzeit direkt in den Arbeitsspeicher eingelesen.

Workflow mit verwalteten Glossaren

Wichtig

UTF-16 LE ist das einzige akzeptierte Dateiformat für Ordner mit verwalteten Glossaren (managed-glossary). Weitere Informationen zum Codieren von Dateien finden Sie unterCodierung.

  1. Um mit der manuellen Erstellung der Ordnerstruktur zu beginnen, müssen Sie Ihren Ordner erstellen und benennen. Der Ordner „managed-glossary“ ist im UTF-16 LE BOM-Format codiert und schachtelt die Quell- und Zielsprachdateien für phrasefix oder sentfix. Benennen Sie Ihren Ordner mit customhotfix. Jeder Ordner kann phrasefix- und sentfix-Dateien enthalten. Stellen Sie die Sprachcodes für Quelle (src) und Ziel (tgt) mit der folgenden Namenskonvention bereit:

    Format von Glossardateinamen Beispieldateiname
    {src}.{tgt}.{container-glossary}.{phrase​fix}.src.snt en.es.container-glossary.phrasefix.src.snt
    {src}.{tgt}.{container-glossary}.{phrase​fix}.tgt.snt en.es.container-glossary.phrasefix.tgt.snt
    {src}.{tgt}.{container-glossary}.{sent​fix}.src.snt en.es.container-glossary.sentfix.src.snt
    {src}.{tgt}.{container-glossary}.{sent​fix}.tgt.snt en.es.container-glossary.sentfix.tgt.snt

    Hinweis

    • Die phrasefix-Lösung ist ein exakter Such- und Ersetzungsvorgang. Alle Wörter oder Ausdrücke werden auf die angegebene Weise übersetzt.
    • Die sentfix-Lösung ist präziser und ermöglicht Ihnen, eine genaue Zielübersetzung für einen Quellsatz anzugeben. Damit eine Satzübereinstimmung gefunden wird, muss der gesamte übermittelte Satz dem sentfix-Eintrag entsprechen. Wenn die Übereinstimmung nur für einen Teil des Satzes gilt, stimmt der Eintrag nicht überein.
    • Wenn Sie Bedenken haben, umfassende Änderungen per Suchen-und-Ersetzen vorzunehmen, sollten Sie zunächst ausschließlich die sentfix-Lösung verwenden.
  2. Erstellen Sie als Nächstes eine Datei version.json innerhalb des Ordners customhotfix, um Aktualisierungen von Glossareinträgen dynamisch neu zu laden. Die Datei version.json sollte die folgenden Parameter enthalten: VersionId. Ein Ganzzahlwert.

    Beispieldatei „version.json“

       {
    
        "VersionId": 5
    
        }
    
    

    Tipp

    Sie können das erneute Laden steuern, indem Sie beim Starten des Containers die folgenden Umgebungsvariablen festlegen:

    • HotfixReloadInterval=. Der Standardwert ist 5 Minuten.
    • HotfixReloadEnabled=. Der Standardwert ist true.
  3. Verwenden des Befehls docker run

    Erforderliche Optionen für den Befehl „docker run“

    docker run --rm -it -p 5000:5000 \
    
    -e eula=accept \
    
    -e billing={ENDPOINT_URI} \
    
    -e apikey={API_KEY} \
    
    -e Languages={LANGUAGES_LIST} \
    
    -e HotfixDataFolder={path to glossary folder}
    
    {image}
    

    Beispiel für den Befehl „docker run“

    
    docker run -rm -it -p 5000:5000 \
    -v /mnt/d/models:/usr/local/models -v /mnt/d /customerhotfix:/usr/local/customhotfix \
    -e EULA=accept \
    -e billing={ENDPOINT_URI} \
    -e apikey={API_Key} \
    -e Languages=en,es \
    -e HotfixDataFolder=/usr/local/customhotfix\
    mcr.microsoft.com/azure-cognitive-services/translator/text-translation:latest
    
    

Weitere Informationen