你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

部署用户管理的术语表

借助 Azure AI 翻译容器,可以在自己的环境中运行翻译工具服务的多项功能,并且该容器非常适合特定的安全性和数据治理要求。

在运行具有多层引入过程的容器时,有时你可能会发现需要对句子和/或短语文件实施更新。 由于标准短语和句子文件在运行时已加密并直接读取到内存中,你需要实施快速修复工程解决方案来实现动态更新。 可以使用用户管理的术语表功能实现此更新:

  • 若要部署 phrase​fix 解决方案,需要创建 phrase​fix 术语表文件,从而指定以指定方式翻译列出的短语。

  • 若要部署 sentfix 解决方案,需要创建 sentfix 术语表文件,为源句子指定一个确切的目标翻译。

  • 然后,phrase​fix 和 sentfix 文件将加入翻译请求中,并在运行时直接读取到内存中。

托管术语表工作流

重要

UTF-16 LE 是托管术语表文件夹唯一接受的文件格式。 有关对文件进行编码的详细信息,请参阅编码

  1. 若要开始手动创建文件夹结构,需要创建并命名文件夹。 托管术语表文件夹采用 UTF-16 LE BOM 格式编码,并嵌套 phrase​fix 或 sentfix 源语言和目标语言文件。 将文件夹命名为 customhotfix。 每个文件夹可以有 phrasefix 和 sentfix 文件。 可以按照以下命名约定提供源 (src) 和目标 (tgt) 语言代码:

    术语表文件名格式 示例文件名
    {src}.{tgt}.{container-glossary}.{phrase​fix}.src.snt en.es.container-glossary.phrasefix.src.snt
    {src}.{tgt}.{container-glossary}.{phrase​fix}.tgt.snt en.es.container-glossary.phrasefix.tgt.snt
    {src}.{tgt}.{container-glossary}.{sent​fix}.src.snt en.es.container-glossary.sentfix.src.snt
    {src}.{tgt}.{container-glossary}.{sent​fix}.tgt.snt en.es.container-glossary.sentfix.tgt.snt

    注意

    • phrasefix 解决方案是一个精确的查找和替换操作。 列出的任何单词或短语均按指定方式翻译。
    • sentfix 解决方案更加精确,允许你为源句子指定确切的目标翻译。 若要进行句子匹配,提交的整个句子必须与 sent​fix 条目匹配。 如果只是句子的一部分匹配,则该条目不匹配。
    • 如果你对进行全面的查找和替换更改犹豫不决,我们建议一开始仅使用 sentfix 解决方案。
  2. 接下来,若要动态重新加载术语表条目更新,请在 version.json 文件夹中创建一个 customhotfix 文件。 version.json 文件应包含以下参数:VersionId。 一个整数值。

    Sample version.json file

       {
    
        "VersionId": 5
    
        }
    
    

    提示

    在启动容器时,可以通过设置以下环境变量来控制重载:

    • HotfixReloadInterval=。 默认值为 5 分钟。
    • HotfixReloadEnabled=。 默认值为 true。
  3. 使用 docker run 命令

    Docker 运行命令所需的选项

    docker run --rm -it -p 5000:5000 \
    
    -e eula=accept \
    
    -e billing={ENDPOINT_URI} \
    
    -e apikey={API_KEY} \
    
    -e Languages={LANGUAGES_LIST} \
    
    -e HotfixDataFolder={path to glossary folder}
    
    {image}
    

    Docker 运行命令示例

    
    docker run -rm -it -p 5000:5000 \
    -v /mnt/d/models:/usr/local/models -v /mnt/d /customerhotfix:/usr/local/customhotfix \
    -e EULA=accept \
    -e billing={ENDPOINT_URI} \
    -e apikey={API_Key} \
    -e Languages=en,es \
    -e HotfixDataFolder=/usr/local/customhotfix\
    mcr.microsoft.com/azure-cognitive-services/translator/text-translation:latest
    
    

了解详细信息