使用 Azure AI 影片索引器自定義語言模型

2025-05-30

Azure AI Video Indexer 透過與 Microsoft 自訂語音服務的整合來支援自動語音辨識。您可以上傳適應性文本來自定義語言模型。此文字來自您希望引擎用於適應其詞彙的域名。定型模型之後，會辨識在調適文字中顯示的新單字，並假設預設發音，而語言模型會學習新的可能文字序列。如需 Azure AI Video Indexer 支援的語言清單，請參閱支援的語言。

例如， Kubernetes （在 Azure Kubernetes 服務的內容中），是高度特定的單字。由於此字不熟悉 Azure AI 影片索引器，因此可辨識為社群。將模型定型以將其辨識為 Kubernetes。在其他情況下，文字存在，但語言模型並不預期它們會出現在特定內容中。例如， 容器服務 不是非特定語言模型可辨識為特定單字組的雙字序列。

有兩種方式可以自訂語言模型：

選項 1：編輯 Azure AI 影片索引器產生的文字記錄。藉由編輯和更正文字記錄，您可以定型語言模型，在日後提供更好的結果。
選項 2：上傳文字檔來定型語言模型。檔案可以包含文字清單，就像您想要在影片索引器文字記錄中出現一樣。或者，它可以包含句子和段落中自然包含的相關字組。使用后一種方法取得較佳的結果時，建議您上傳檔案包含與您內容相關的完整句子或段落。

重要

請勿在上傳檔案中包含目前不正確地轉譯的字詞或句子，因為這會否定預期的影響。只包含您想要出現的字組（例如 Kubernetes）。

優化您的自定義語言模型

Azure AI Video Indexer 會根據單字組合的概率進行學習，以達到最佳效果：

盡可能提供可能說出的句子實例。
每行一句，不要超過一句。否則，系統會在不同句子中學習機率。
可以只用一個字來構成一個句子，以便強調該字相對於其他詞的突出，但系統在學習完整句子時效果最佳。
加入新的字詞或縮寫時，盡可能提供多個在完整的句子中使用的範例，以盡量提供給系統最多的內容。
嘗試多種調整選項，看看它們的效果如何。
避免多次重複完全相同的句子。它可能會針對其餘的輸入產生偏差。
避免包含不常見的符號（~， # @ % &），因為它們會被捨棄。出現這些符號的句子也會予以捨棄。
避免過於大量的輸入，例如數十萬個句子，因為這麼做會減弱提升效果。

必要條件

Azure 帳戶
Azure AI 影片索引器帳戶

入口網站
應用程式介面

建立語言模型

前往 Azure AI Video Indexer (英文) 網站並登入。
若要在您的帳戶中自訂模型，請選取頁面左側的 [內容模型自訂] 按鈕。
選取 [ 語言] 索引標籤。您會看到支援的語言清單。
在您想要的語言下方，選取 [新增模型]。
輸入語言模型的名稱，然後按 Enter。此步驟會建立模型，並提供將文字檔案上傳至模型的選項。
若要新增文字檔案，選取 [新增檔案]。您的檔案總管隨即開啟。
前往並選擇文字檔案。您可以將多個文字檔新增至語言模型。您也可以選取 語言模型右側的 [...] 按鈕，然後選取 [新增檔案] 來新增文本檔。
上傳文字檔案完成之後，選取綠色的訓練選項。

定型程序可能需要數分鐘的時間。訓練完成後，[已訓練] 會出現在模型旁邊。您可以從模型預覽、下載和刪除檔案。

在新影片上使用語言模型

若要在新影片上使用您的語言模型，請執行下列其中一個動作：

選取頁面頂端的 [ 上傳 ]。
您可以拖曳您的音訊或影片檔案，或瀏覽以選擇檔案。
從 [ 影片來源語言 ] 列表中選取您建立的語言模型。
選取頁面底部的 [上傳] 選項，並使用您的語言模型編製新影片的索引。

使用語言模型重新編製索引

登入 Azure AI Video Indexer 首頁。
選取影片上的省略號（...），然後選取 [重新編製索引]。
選取 [ 影片來源語言 ] 列表，然後從清單中選取您建立的語言模型。
選取 [重新編制索引] ，並使用您的語言模型重新編製影片索引。

編輯語言模型

您可以藉由變更語言模型的名稱、新增檔案，以及從中刪除檔案，來編輯語言模型。如果您從語言模型新增或刪除檔案，您必須選取綠色的 [ 定型] 選項來重新定型模型。

重新命名語言模型

您可以選取語言模型右側的省略號，然後選取 [ 重新命名] 來變更語言模型的名稱。輸入新名稱。

新增檔案

選取 [Add file] (新增檔案)。您的檔案總管隨即開啟。
前往並選擇文字檔案。您可以將多個文字檔新增至語言模型。

您也可以選取語言模型右側的省略號（...）按鈕，然後選取 [ 新增檔案] 來新增文本檔。

刪除檔案

此動作會從語言模型完全移除檔案。

選取文字文件右側的省略號（...）按鈕。
選取 [刪除]。新視窗跳出，提醒您刪除無法復原。
選取新視窗中的 [刪除] 選項。

刪除語言模型

此動作會從您的帳戶中完全移除語言模型。使用已刪除語言模型的任何影片會保留相同的索引，直到您重新編製影片索引為止。如果您重新編製影片的索引，您可以將新的語言模型指派給影片。否則，Azure AI Video Indexer 會使用其預設模型重新編製影片索引。

選取語言模型右側的省略號（...）按鈕。
選取 [刪除]。新視窗跳出，提醒您刪除無法復原。
選取新視窗中的 [刪除] 選項。

透過更正轉錄文字來自訂語言模型

Azure AI 影片索引器會根據使用者對影片轉譯進行的實際更正，自定義語言模型。它會擷取您在視訊轉譯中更正的所有行，並將其新增至名為 From transcript edits的文本檔。這些編輯可用來重新定型用來編製影片索引的語言模型。

也包含在小工具的時間軸中進行的編輯。

如果您在編制此影片的索引時未指定語言模型，則此影片的所有編輯都會儲存在影片偵測到的語言內呼叫 Account adaptations 的默認語言模型。

如果對同一行進行多個編輯，則只會使用最後一個版本的更正行來更新語言模型。

注意

文字更正只會用於自訂。不包括不涉及文字的更動（例如，標點符號或空格）。

從文檔庫選取您想要編輯的影片。
選取 [時間軸] 索引標籤。
選取鉛筆圖示以編輯轉譯的文字記錄。
您會看到文字記錄更正出現在內容模型自訂頁面的 [ 語言 ] 索引標籤中。若要查看每個語言模型的「文字記錄編輯來源」檔案，請選取該檔案加以開啟。

建立語言模型

您可以提出建立語言模型 API 要求，為指定的帳戶建立新的自定義語言模型。您可以使用此要求來上傳語言模型的檔案。或者，您可以在這裡建立語言模型，稍後藉由更新語言模型來上傳模型的檔案。

除了提供必要參數的值之外，您還必須在請求內文中使用 FormData 上傳檔案。有兩種方式可定義這項工作的密鑰組：

索引鍵是檔案名稱，而值則是 txt 檔案。
索引鍵是檔案名稱，而值則是 txt 檔案的 URL。

注意

您仍然必須使用已啟用的檔案來訓練模型，以使模型學習其檔案的內容。

範例回應

{
    "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
    "name": "TestModel",
    "language": "En-US",
    "state": "None",
    "languageModelId": "00000000-0000-0000-0000-000000000000",
    "files": [
    {
        "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.6733333"
    },
    {
        "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
        "name": "worldfile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.86"
    }
    ]
}

定型語言模型

訓練型語言模型的請求會使用語言模型中上傳和啟用檔案的內容，為指定的帳戶訓練自定義語言模型。

注意

您必須先建立語言模型並上傳其檔案。您可以在建立語言模型或更新語言模型時上傳檔案。

範例回應

{
    "id": "41464adf-e432-42b1-8e09-f52905d7e29d",
    "name": "TestModel",
    "language": "En-US",
    "state": "Waiting",
    "languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
    "files": [
    {
        "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
        "name": "RenamedFile",
        "enable": false,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.5233333"
    },
    {
        "id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.68"
    }
    ]
}

id是用來區分語言模型的唯一標識符。不過， languageModelId 用於上傳影片以編製索引並重新編製視訊要求索引。它們也稱為 linguisticModelId Azure AI 影片索引器上傳/重新編製索引要求。

刪除語言模型

您可以使用刪除語言模型 API 要求，從指定的帳戶中刪除自定義語言模型。使用所刪除語言模型的任何影片都會保留相同的索引，直到您重新編製影片索引為止。如果您重新編製影片索引，可以將新的語言模型指派給該影片。否則，Azure AI Video Indexer 會使用其預設模型重新編製影片索引。

範例回應

成功刪除語言模型時，不會傳回內容。

更新語言模型

更新語言模型要求會更新指定帳戶中的自定義語言人員模型。

注意

請確定您已建立語言模型。您可以使用呼叫：啟用或停用模型下的所有檔案、更新語言模型的名稱，以及上傳要新增至語言模型的檔案。

若要上傳要新增至語言模型的檔案，您必須使用 FormData 在主體中上傳檔案。您也必須提供先前所述的必要參數值。若要完成工作，有兩種方式：

索引鍵是檔案名稱，而值則是 txt 檔案。
索引鍵是檔案名稱，而值則是 txt 檔案的 URL。

範例回應

{
    "id": "41464adf-e432-42b1-8e09-f52905d7e29d",
    "name": "TestModel",
    "language": "En-US",
    "state": "Waiting",
    "languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
    "files": [
    {
        "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
        "name": "RenamedFile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.5233333"
    },
    {
        "id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.68"
    }
    ]
}

若要下載檔案的內容，請使用回應中傳回之檔案的id識別碼。

從語言模型更新檔案

更新語言模型檔案要求可讓您在指定帳戶的自定義語言模型中更新檔案的名稱和enable狀態。

範例回應

{
  "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
  "name": "RenamedFile",
  "enable": false,
  "creator": "John Doe",
  "creationTime": "2018-04-27T20:10:10.5233333"
}

若要下載檔案內容，請使用回應中返回的文件id。

取得特定語言模型

您可以提出取得語言模型 API 要求，以傳回指定帳戶中指定語言模型的資訊，例如語言和語言模型中的檔案。

範例回應

{
    "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
    "name": "TestModel",
    "language": "En-US",
    "state": "None",
    "languageModelId": "00000000-0000-0000-0000-000000000000",
    "files": [
    {
        "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.6733333"
    },
    {
        "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
        "name": "worldfile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.86"
    }
    ]
}

若要下載檔案內容，請使用回應中返回的文件id。

取得所有語言模型

您可以使用取得語言模型 API 要求，傳回清單中指定帳戶中的所有自定義語言模型。

範例回應

[
    {
        "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
        "name": "TestModel",
        "language": "En-US",
        "state": "None",
        "languageModelId": "00000000-0000-0000-0000-000000000000",
        "files": [
        {
            "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
            "name": "hellofile",
            "enable": true,
            "creator": "John Doe",
            "creationTime": "2018-04-28T11:55:34.6733333"
        },
        {
            "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
            "name": "worldfile",
            "enable": true,
            "creator": "John Doe",
            "creationTime": "2018-04-28T11:55:34.86"
        }
        ]
    },
    {
        "id": "dfae5745-6f1d-4edd-b224-42e1ab57a892",
        "name": "AnotherTestModel",
        "language": "En-US",
        "state": "None",
        "languageModelId": "00000000-0000-0000-0000-000000000001",
        "files": []
    }
]

從語言模型刪除檔案

刪除語言模型檔案要求會從指定帳戶中的指定語言模型刪除指定的檔案。

範例回應

成功從語言模型刪除檔案時，不會傳回內容。

從語言模型取得檔案的詮釋資料

取得語言模型檔案數據要求會從您帳戶中所選語言模型傳回指定檔案的內容和元數據。

範例回應

{
    "content": "hello\r\nworld",
    "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
    "name": "Hello",
    "enable": true,
    "creator": "John Doe",
    "creationTime": "2018-04-27T20:10:10.5233333"
}

注意

此範例檔案的內容是在兩行中分別寫下「hello」和「world」。

從語言模型下載檔案

下載語言模型檔案內容要求會從指定帳戶中的指定語言模型下載包含指定檔案內容的文本檔。此文字檔應符合原本上傳之文字檔的內容。

範例回應

回應是下載包含檔案內容並以 JSON 格式表示的文字檔。

共用方式為

使用 Azure AI 影片索引器自定義語言模型

優化您的自定義語言模型

必要條件

建立語言模型

在新影片上使用語言模型

使用語言模型重新編製索引

編輯語言模型

重新命名語言模型

新增檔案

刪除檔案

刪除語言模型

透過更正轉錄文字來自訂語言模型

意見反應

其他資源