Share via


主題推斷

重要

由於 Azure 媒體服務 淘汰公告,Azure AI 影片索引器會宣告 Azure AI 影片索引器功能調整。 請參閱 Azure 媒體服務 (AMS) 淘汰 的相關變更,以瞭解 Azure AI 影片索引器帳戶的意義。 請參閱準備AMS淘汰:VI更新和移轉指南

主題推斷是 Azure AI 影片索引器 AI 功能,可自動建立衍生自轉譯音訊的推斷深入解析、視覺文字中的 OCR 內容,以及使用影片索引器臉部辨識模型辨識的名人。 擷取的主題和類別(可用時)會列在 [深入解析] 索引卷標中。若要跳至媒體檔案中的主題,請按兩下 [主題 -> 播放上一頁] 或 [下一步]。

產生的深入解析也會在 JSON 檔案的分類清單中產生,其中包含主題名稱、時間範圍和信賴分數。

必要條件

檢閱 透明度附注概觀

一般準則

本文討論有關負責任地使用這項技術的主題和重要考慮。 決定如何使用和實作 AI 支援的功能時,需要考慮許多事項:

  • 這項功能是否會在我的案例中表現良好? 在將主題推斷部署到您的案例之前,請先測試其如何使用實際數據執行,並確定它可以提供您需要的正確性。
  • 我們是否有能力識別和因應錯誤? AI 支援的產品和功能不會正確 100%,因此請考慮您將如何識別並回應可能發生的任何錯誤。

檢視深入解析

若要在網站上顯示主題推斷深入解析。

  1. 移至 [深入解析],然後捲動至 [主題]。

若要在 JSON 檔案中顯示實體,請執行下列動作:

  1. 按兩下 [下載 -> 深入解析] (JSON)。

  2. 複製文字並 topics 貼到 JSON 查看器中。

    "topics": [
      {
        "id": 1,
        "name": "Pens",
        "referenceId": "Category:Pens",
        "referenceUrl": "https://en.wikipedia.org/wiki/Category:Pens",
        "referenceType": "Wikipedia",
        "confidence": 0.6833,
        "iabName": null,
        "language": "en-US",
        "instances": [
          {
            "adjustedStart": "0:00:30",
            "adjustedEnd": "0:01:17.5",
            "start": "0:00:30",
            "end": "0:01:17.5"
          }
        ]
      },
      {
        "id": 2,
        "name": "Musical groups",
        "referenceId": "Category:Musical_groups",
        "referenceUrl": "https://en.wikipedia.org/wiki/Category:Musical_groups",
        "referenceType": "Wikipedia",
        "confidence": 0.6812,
        "iabName": null,
        "language": "en-US",
        "instances": [
          {
            "adjustedStart": "0:01:10",
            "adjustedEnd": "0:01:17.5",
            "start": "0:01:10",
            "end": "0:01:17.5"
          }
        ]
      },
    

若要透過 API 下載 JSON 檔案,請使用 Azure AI 影片索引器開發人員入口網站

如需詳細資訊,請參閱 主題

主題元件

在主題索引編製程序期間,會擷取主題,如下所示:

元件 定義
來源語言 用戶上傳要編製索引的來源檔案。
前處理 轉譯、OCR和臉部辨識 AIS 會從媒體檔案擷取深入解析。
深入解析處理 AI 主題會分析預先處理期間擷取的轉譯、OCR 和臉部辨識見解:
- 轉譯的文字,會使用以內部學為基礎的 AI 技術來檢查每一行轉譯的文字深入解析。
- OCR 和臉部辨識深入解析會使用以內部學為基礎的 AI 技術一起檢查。
後續處理 - 轉譯的文字、深入解析會擷取並系結至主題類別,以及轉譯文字的行號。 例如,第 7 行中的政治。
- OCR 和臉部辨識,每個深入解析都會系結至主題類別,以及媒體檔案中主題實例的時間。 例如,人員 和音樂類別中的Freddie Mercury在20.00。
信賴值 每個主題的估計信賴等級會計算為 0 到 1 的範圍。 信賴分數代表結果精確度的確定性。 例如,82% 的確定性會以 0.82 分數表示。

範例使用案例

  • 使用主題推斷來符合客戶興趣的個人化,例如有關英格蘭的網站張貼有關英國電影或節日的促銷。
  • 深入搜尋封存以深入瞭解特定主題,以建立公司、人物或技術等功能故事,例如通訊社。
  • 獲利,增加擷取見解的價值。 例如,依賴廣告收益的新聞或社交媒體等產業可以使用擷取的深入解析作為廣告伺服器的額外訊號來提供相關的廣告。

選擇使用案例時的考慮和限制

以下是使用主題時要牢記的一些考慮:

  • 上傳檔案時,一律使用高品質的視訊內容。 建議的最大畫面大小是 HD,幀速率為 30 FPS。 框架不應包含超過10人。 從影片輸出畫面到 AI 模型時,僅每秒傳送大約 2 或 3 個畫面格。 處理10個以上的畫面可能會延遲 AI 結果。
  • 上傳檔案時,一律使用高品質的音訊和視訊內容。 至少需要 1 分鐘的自發對話式語音才能執行分析。 音訊效果只會在非語音區段中偵測到。 非語音區段的最小持續時間為2秒。 不支援語音命令和唱歌。
  • 一般而言,小於 200 像素的小型人員或物件和坐著的人可能無法偵測到。 人員 身穿類似衣服或制服的可能偵測到身為同一個人,並將得到相同的標識符。 人員 或遭到阻礙的物件可能無法偵測到。 正面和後置姿勢的追蹤可能會分割成不同的實例。

在負責任且謹慎地使用時,Azure AI 影片索引器是許多產業的寶貴工具。 若要尊重他人的隱私權和安全性,以及遵守當地和全球法規,我們建議下列各項:

  • 一律尊重個人的隱私權,只針對合法和合理的目的內嵌影片。
  • 不要故意披露不適當的媒體,顯示年幼的孩子或名人的家庭成員或其他可能有害或對個人個人自由構成威脅的內容。
  • 致力於在分析媒體的設計和部署中尊重和促進人權。
  • 使用第三方數據時,在發佈衍生自它們的內容之前,請注意任何現有的著作權或許可權。
  • 使用來自不明來源的媒體時,總是尋求法律建議。
  • 請務必取得適當的法律和專業建議,以確保您上傳的影片受到保護,並具有適當的控制,以保留內容的完整性,並防止未經授權的存取。
  • 提供意見反應通道,可讓用戶和個人回報服務的問題。
  • 請注意您區域中任何有關處理、分析和共用包含人員之媒體的適用法律或法規。
  • 將人類保留在迴圈中。 請勿使用任何解決方案來取代人為監督和決策。
  • 完整檢查並檢閱您用來瞭解其功能和限制的任何 AI 模型的潛力。