使用 Azure AI 视频索引器自定义语言模型

2025-05-30

Azure AI 视频索引器通过与Microsoft 自定义语音服务集成支持自动语音识别。可以通过上传适应文本来自定义语言模型。此文本来自你希望引擎使用其词汇进行适应的领域。训练模型后，将识别适应文本中显示的新单词，假设默认发音，语言模型会学习新的可能字词序列。请参阅Azure AI视频索引器支持的语言列表中的支持语言。

例如， Kubernetes（在 Azure Kubernetes 服务的上下文中），是一个高度具体的单词。由于该词是 Azure AI 视频索引器的新词，因此会被识别为社区。训练模型以将其识别为 Kubernetes。在其他情况下，这些单词存在，但语言模型不希望它们出现在特定上下文中。例如， 容器服务 不是非特定语言模型识别为特定字词集的双字序列。

可通过两种方法自定义语言模型：

选项 1：编辑 Azure AI 视频索引器生成的脚本。通过编辑和更正脚本，你将训练语言模型，以在未来提供改进的结果。
选项 2：上传文本文件以训练语言模型。该文件可以包含一个单词列表，就像希望它们显示在视频索引器脚本中一样。或者，它可以包含句子和段落中自然包含的相关字词。由于使用后一种方法获得更好的结果，我们建议上传文件包含与内容相关的完整句子或段落。

重要

请勿将当前错误转录（例如社区）的字词或句子包含在上传文件中，因为这将否定预期的影响。仅包括您希望显示的词语（例如 Kubernetes）。

优化自定义语言模型

Azure AI 视频索引器根据单词组合的概率学习，从而达到最佳学习效果：

提供生活中会这样用的真实句子示例，且数量需足够多。
每行只用一个句子，不要使用多个句子。否则，系统会跨句子学习概率。
可以通过将一个词作为一个句子来突出该词相对于其他词，但是系统最好从完整的句子中学习。
引入新的字或首字母缩略词时，尽可能提供大量完整句子用例，从而为系统提供尽量多的上下文。
尝试使用数个适应选项，看看它们的效果。
避免多次重复一模一样的句子。它可能会针对输入的其余部分产生偏差。
避免包括不常见的符号（~， # @ % &），因为它们会被丢弃。它们出现的句子也会被丢弃。
避免输入过大（例如数十万个句子），因为这样做会削弱提升效果。

先决条件

一个 Azure 帐户
Azure AI 视频索引器帐户

Web 门户
应用程序接口

创建语言模型

转到 Azure AI 视频索引器网站并登录。
若要自定义帐户中的模型，请选择页面左侧的“内容模型自定义”按钮。
选择“语言”选项卡。你将看到受支持的语言列表。
在所需语言下选择“添加模型”。
键入语言模型的名称并按 Enter。此步骤可创建模型并提供将文本文件上传到模型的选项。
若要添加文本文件，请选择“添加文件”。此时会打开文件资源管理器。
导航到文本文件并将其选中。可以将多个文本文件添加到语言模型。还可以通过选择 语言模型右侧的 ... 按钮并选择 “添加文件”来添加文本文件。
上传完文本文件以后，请选择绿色的“训练”选项。

训练过程可能需要数分钟。训练完成后，训练将显示在模型旁边。可以预览、下载和删除模型中的此文件。

在新视频上使用语言模型

若要在新视频上使用语言模型，请执行以下操作之一：

选择页面顶部的 “上传 ”。
放置音频或视频文件或者以浏览方式查找文件。
从 视频源语言 列表中选择创建的语言模型。
选择页面底部的 “上传 ”选项，并使用语言模型为新视频编制索引。

使用语言模型重新编制索引

登录到 Azure AI 视频索引器主页。
选择视频上的省略号（...），然后选择 “重新索引”。
选择 视频源语言 列表，然后从列表中选择创建的语言模型。
选择 “重新索引” ，并使用语言模型重新编制视频索引。

编辑语言模型

可以通过更改语言模型的名称、向其添加文件以及从中删除文件来编辑语言模型。如果从语言模型添加或删除文件，则必须通过选择绿色 的“训练 ”选项再次训练模型。

重命名语言模型

可以通过选择语言模型右侧的省略号（...）并选择 “重命名”来更改语言模型的名称。输入新名称。

添加文件

选择“添加文件”。此时会打开文件资源管理器。
导航到文本文件并将其选中。可以将多个文本文件添加到语言模型。

还可以通过在语言模型右侧选择省略号（...）按钮并选择 “添加文件”来添加文本文件。

删除文件

此操作将完全从语言模型中删除文件。

选择文本文件右侧的省略号（...）按钮。
选择“删除”。此时会弹出一个新窗口，指出删除操作无法撤消。
在新窗口中选择“删除”选项。

删除语言模型

此操作会完全从帐户中删除语言模型。使用已删除语言模型的任何视频都保留相同的索引，直到重新编制视频索引。如果重新编制视频索引，可以将新的语言模型分配给视频。否则，Azure AI 视频索引器使用其默认模型重新编制视频索引。

选择语言模型右侧的省略号（...）按钮。
选择“删除”。此时会弹出一个新窗口，指出删除操作无法撤消。
在新窗口中选择“删除”选项。

通过更正脚本来自定义语言模型

语言模型根据用户对其视频转录的实际修正进行定制，由 Azure AI 视频索引器完成。它捕获你在视频听录中更正的所有行，并将其添加到名为 From transcript edits 的文本文件中。这些编辑用于重新训练用于为视频编制索引的语言模型。

还包括在小组件的时间线中进行的编辑。

如果在为此视频编制索引时未指定语言模型，则此视频的所有编辑都将存储在检测到的视频语言中名为 Account adaptations 的默认语言模型中。

如果对同一行进行了多次编辑，则只使用更正行的最后一个版本来更新语言模型。

注意

仅使用文本更正进行自定义。不包括不涉及实际字词的更正（例如，标点符号或空格）。

从库中选择要编辑的视频。
选择“时间线”选项卡。
选择铅笔图标以编辑听录的脚本。
“内容模型自定义”页的“ 语言 ”选项卡中会显示脚本更正。若要查看每个语言模型的“来自脚本编辑”文件，请将其选中并打开。

创建语言模型

可以发出创建语言模型 API 请求，为指定的帐户创建新的自定义语言模型。可以使用此请求上传语言模型的文件。或者，可以在此处创建语言模型，稍后通过更新语言模型来上传模型的文件。

除了提供必需参数的值外，还必须使用 FormData 在正文中上传文件。可通过两种方法定义此任务的密钥对：

键是文件名，值为 txt 文件。
密钥是文件名，值为 txt 文件的 URL。

注意

仍必须使用模型的已启用文件来训练该模型，以学习其文件的内容。

示例响应

{
    "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
    "name": "TestModel",
    "language": "En-US",
    "state": "None",
    "languageModelId": "00000000-0000-0000-0000-000000000000",
    "files": [
    {
        "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.6733333"
    },
    {
        "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
        "name": "worldfile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.86"
    }
    ]
}

训练语言模型

训练语言模型请求使用语言模型中已上传和启用的文件内容，为指定帐户训练自定义语言模型。

注意

必须先创建语言模型并上传其文件。可以在创建语言模型时或通过更新语言模型来上传文件。

示例响应

{
    "id": "41464adf-e432-42b1-8e09-f52905d7e29d",
    "name": "TestModel",
    "language": "En-US",
    "state": "Waiting",
    "languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
    "files": [
    {
        "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
        "name": "RenamedFile",
        "enable": false,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.5233333"
    },
    {
        "id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.68"
    }
    ]
}

id这是用于区分语言模型的唯一 ID。但是， languageModelId 用于上传视频以索引和重新编制视频请求索引。它们在 Azure AI 视频索引器的上传/重新编制索引请求中也被称为 linguisticModelId。

删除语言模型

可以使用删除语言模型 API 请求从指定的帐户中删除自定义语言模型。使用已删除语言模型的任何视频都保留相同的索引，直到重新编制视频索引。如果重新为视频编制索引，可为视频分配新的语言模型。否则，Azure AI 视频索引器使用其默认模型重新编制视频索引。

示例响应

成功删除语言模型时，没有返回的内容。

更新语言模型

更新语言模型请求更新指定帐户中的自定义语言人员模型。

注意

请确保已创建语言模型。可以使用调用来：启用或禁用模型下的所有文件、更新语言模型的名称，以及上传要添加到语言模型的文件。

若要上传要添加到语言模型的文件，必须使用 FormData 在正文中上传文件。还必须提供前面提到的必需参数的值。若要完成任务，有两种方法：

键是文件名，值为 txt 文件。
密钥是文件名，值为 txt 文件的 URL。

示例响应

{
    "id": "41464adf-e432-42b1-8e09-f52905d7e29d",
    "name": "TestModel",
    "language": "En-US",
    "state": "Waiting",
    "languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
    "files": [
    {
        "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
        "name": "RenamedFile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.5233333"
    },
    {
        "id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.68"
    }
    ]
}

若要下载文件的内容，请使用响应中返回文件的id来进行下载。

从语言模型更新文件

通过更新语言模型文件请求，可以在指定帐户的自定义语言模型中更新文件的名称和 enable 状态。

示例响应

{
  "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
  "name": "RenamedFile",
  "enable": false,
  "creator": "John Doe",
  "creationTime": "2018-04-27T20:10:10.5233333"
}

若要下载文件的内容，请使用响应中返回文件的 id。

获取特定语言模型

可以发出获取语言模型 API 请求，以返回指定帐户中指定语言模型的信息，例如语言模型和语言模型中的文件。

示例响应

{
    "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
    "name": "TestModel",
    "language": "En-US",
    "state": "None",
    "languageModelId": "00000000-0000-0000-0000-000000000000",
    "files": [
    {
        "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.6733333"
    },
    {
        "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
        "name": "worldfile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.86"
    }
    ]
}

若要下载文件的内容，请使用响应中返回文件的 id。

获取所有语言模型

可以使用获取语言模型 API 请求返回列表中指定帐户中的所有自定义语言模型。

示例响应

[
    {
        "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
        "name": "TestModel",
        "language": "En-US",
        "state": "None",
        "languageModelId": "00000000-0000-0000-0000-000000000000",
        "files": [
        {
            "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
            "name": "hellofile",
            "enable": true,
            "creator": "John Doe",
            "creationTime": "2018-04-28T11:55:34.6733333"
        },
        {
            "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
            "name": "worldfile",
            "enable": true,
            "creator": "John Doe",
            "creationTime": "2018-04-28T11:55:34.86"
        }
        ]
    },
    {
        "id": "dfae5745-6f1d-4edd-b224-42e1ab57a892",
        "name": "AnotherTestModel",
        "language": "En-US",
        "state": "None",
        "languageModelId": "00000000-0000-0000-0000-000000000001",
        "files": []
    }
]

从语言模型中删除文件

删除语言模型文件请求从指定帐户中的指定语言模型中删除指定文件。

示例响应

成功从语言模型中删除文件时，不会返回任何内容。

通过语言模型获取文件的元数据

获取语言模型文件数据请求从帐户中所选语言模型返回指定文件的内容和元数据。

示例响应

{
    "content": "hello\r\nworld",
    "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
    "name": "Hello",
    "enable": true,
    "creator": "John Doe",
    "creationTime": "2018-04-27T20:10:10.5233333"
}

注意

此示例文件的内容是两个独立行中的单词“hello”和“world”。

从语言模型下载文件

下载语言模型文件内容请求从指定帐户中的指定语言模型下载包含指定文件内容的文本文件。此文本文件应与最初上传的文本文件的内容相匹配。

示例响应

响应是下载包含 JSON 格式的文件内容的文本文件。

通过

使用 Azure AI 视频索引器自定义语言模型

优化自定义语言模型

先决条件

创建语言模型

在新视频上使用语言模型

使用语言模型重新编制索引

编辑语言模型

重命名语言模型

添加文件

删除文件

删除语言模型

通过更正脚本来自定义语言模型

反馈

其他资源