Share via


Använda ordlistor med dokumentöversättning

En ordlista är en lista med termer med definitioner som du skapar för dokumentöversättningstjänsten som ska användas under översättningsprocessen. För närvarande stöder ordlistefunktionen en-till-en-språköversättning från källa till mål. Vanliga användningsfall för ordlistor är:

  • Kontextspecifik terminologi. Skapa en ordlista som anger specifika betydelser för din unika kontext.

  • Ingen översättning. Du kan till exempel begränsa dokumentöversättningen från att översätta produktnamnsmärken med hjälp av en ordlista med samma käll- och måltext.

  • Angivna översättningar för tvetydiga ord. Välj en specifik översättning för polysemantiska ord.

Skapa, ladda upp och använda en ordlistefil

  1. Skapa ordlistefilen. Skapa en fil i ett format som stöds (helst tabbavgränsade värden) som innehåller alla termer och fraser som du vill använda i översättningen.

    Information om hur du kontrollerar om filformatet stöds finns iHämta ordlisteformat som stöds.

    Följande ordlista på engelska innehåller ord som kan ha olika betydelser beroende på i vilken kontext de används. Ordlistan innehåller den förväntade översättningen för varje ord i filen för att säkerställa noggrannheten.

    När ordet Bank till exempel visas i ett finansiellt dokument bör det översättas så att det återspeglar dess ekonomiska betydelse. Om ordet Bank förekommer i ett geografiskt dokument kan det referera till land för att återspegla dess topografiska betydelse. På samma sätt kan ordet Crane referera till antingen en fågel eller maskin.

    Exempelordlista .tsv-fil: engelska till franska

       Bank     Banque
       Card     Carte
       Crane    Grue
       Office   Office
       Tiger    Tiger
       US       United States
    
  2. Ladda upp ordlistan till Azure Storage. För att slutföra det här steget behöver du ett Azure Blob Storage-konto med containrar för att lagra och organisera dina blobdata i ditt lagringskonto.

  3. Ange ordlistan i översättningsbegäran. glossary URLInkludera , formatoch version i din POST begäran:

    {
        "inputs": [
            {
                "source": {
                    "sourceUrl": "https://my.blob.core.windows.net/source-en"
                },
                "targets": [
                    {
                         "targetUrl": "https://my.blob.core.windows.net/target-fr",
                        "language": "fr",
                        "glossaries": [
                            {
                                "glossaryUrl": "https://my.blob.core.windows.net/glossaries/en-fr.tsv",
                                "format": "tsv"
                            }
                        ]
    
                    }
                ]
            }
        ]
    }
    

    Anteckning

    I exemplet användes en aktiverad systemtilldelad hanterad identitet med rolltilldelningen Storage Blob Data Contributor för auktorisering. Mer information finns iHanterade identiteter för dokumentöversättning.

Skiftlägeskänslighet

Som standard är Azure AI Translator-tjänst-API:et skiftlägeskänsligt, vilket innebär att det matchar termerna i källtexten baserat på skiftläge.

  • Program för partiell mening. När ordlistan tillämpas på en del av en mening kontrollerar API:et för dokumentöversättning om ordlistan matchar fallet i källtexten. Om höljet inte matchar tillämpas inte ordlistan.

  • Slutför meningsprogrammet. När ordlistan tillämpas på en fullständig mening blir tjänsten skiftlägeskänslig. Den matchar ordlistans term oavsett dess skiftläge i källtexten. Denna bestämmelse tillämpar rätt resultat för användningsfall som rör idiomer och citattecken.

Nästa steg

Prova guiden för dokumentöversättning för att asynkront översätta hela dokument med ett programmeringsspråk som du väljer: