Share via


使用詞彙搭配文件翻譯

詞彙是一份字詞清單,其中包含您針對文件翻譯服務建立以在翻譯過程中使用的定義。 目前,詞彙功能支援一對一的來源對目標語言翻譯。 詞彙的常見使用案例包括:

  • 內容專用術語。 建立詞彙,以指定獨特內容的特定意義。

  • 無翻譯。 例如,您可使用包含相同來源和目標文字的詞彙,限制文件翻譯來翻譯產品名稱品牌。

  • 模棱兩可文字的指定翻譯。 選擇多義單字的特定翻譯。

建立、上傳及使用詞彙檔案

  1. 建立您的詞彙檔案。 以支援的格式建立檔案 (最好是以定位字元分隔值),其中包含您想要在翻譯中使用的所有字詞和片語。

    若要檢查您的檔案格式是否受到支援,請參閱取得支援的詞彙格式

    下列英文來源詞彙包含的字組可能會根據其使用所在的內容而有不同的意義。 詞彙會提供檔案中每個單字的預期翻譯,以協助確保精確度。

    例如,當 Bank 一字出現在金融文件時,該字應會進行翻譯以反映其金融意義。 如果 Bank 一字出現在地理文件中,該字可能是指海濱以反映其地形意義。 同樣地,Crane 這個字可以是指鳥或機器。

    範例詞彙 .tsv 檔案:英文到法文

       Bank     Banque
       Card     Carte
       Crane    Grue
       Office   Office
       Tiger    Tiger
       US       United States
    
  2. 將您的詞彙上傳至 Azure 儲存體。 若要完成此步驟,您需要有有容器Azure Blob 儲存體帳戶,以儲存及組織儲存體帳戶內的 Blob 資料。

  3. 在翻譯要求中指定您的詞彙。 在您的 POST 要求中包含 glossary URLformatversion

    {
        "inputs": [
            {
                "source": {
                    "sourceUrl": "https://my.blob.core.windows.net/source-en"
                },
                "targets": [
                    {
                         "targetUrl": "https://my.blob.core.windows.net/target-fr",
                        "language": "fr",
                        "glossaries": [
                            {
                                "glossaryUrl": "https://my.blob.core.windows.net/glossaries/en-fr.tsv",
                                "format": "tsv"
                            }
                        ]
    
                    }
                ]
            }
        ]
    }
    

    注意

    此範例使用了具有儲存體 Blob 資料參與者角色指派的已啟用系統指派受控識別,進行授權。 若要深入了解,請參閱文件翻譯的受控識別

區分大小寫

根據預設,Azure AI 翻譯工具服務 API 會區分大小寫,這表示它會根據大小寫比對來源文字中的字詞。

  • 部分句子應用程式。 當您的詞彙套用至句子的一部分時,文件翻譯 API 會檢查詞彙字詞是否符合來源文字中的大小寫。 如果大小寫不相符,則不會套用詞彙。

  • 完成句子應用程式。 當您的詞彙套用至完成句子時,服務會變成 不區分大小寫。 不論詞彙字詞在來源文字中的大小寫為何,都會進行比對。 此佈建會針對涉及慣用語和引述的使用案例套用正確的結果。

下一步

請嘗試文件翻譯操作指南,使用您選擇的程式設計語言以非同步方式翻譯整份文件: