Share via


關鍵詞擷取

重要

由於 Azure 媒體服務 淘汰公告,Azure AI 影片索引器會宣告 Azure AI 影片索引器功能調整。 請參閱 Azure 媒體服務 (AMS) 淘汰 的相關變更,以瞭解 Azure AI 影片索引器帳戶的意義。 請參閱準備AMS淘汰:VI更新和移轉指南

關鍵詞擷取是 Azure AI 影片索引器 AI 功能,可自動偵測媒體檔案中所討論之不同關鍵詞的深入解析。 關鍵詞擷取可以在單一語言和多語言媒體檔案中擷取深入解析。 擷取關鍵詞及其類別總數列在 [深入解析] 索引標籤中,按兩下 [關鍵詞],然後按兩下 [播放上一頁] 或 [播放下一步] 跳至媒體檔案中的 關鍵詞。

必要條件

檢閱 透明度附注概觀

一般準則

本文討論關鍵詞和負責任地使用這項技術的重要考慮。 決定如何使用和實作 AI 支援的功能時,需要考慮許多事項:

  • 這項功能是否會在我的案例中表現良好? 在將關鍵詞擷取部署到您的案例之前,請先測試如何使用實際數據執行,並確定它可以提供您需要的正確性。
  • 我們是否有能力識別和因應錯誤? AI 支援的產品和功能不會正確 100%,因此請考慮您將如何識別並回應可能發生的任何錯誤。

檢視深入解析

在網站上工作時,深入解析會顯示在 [ 深入解析 ] 索引卷標中。它們也可以在 JSON 檔案的分類清單中產生,其中包含關鍵詞的標識碼、文字,以及每個關鍵詞的特定開始和結束時間和信賴分數。

若要在 JSON 檔案中顯示實體,請執行下列動作:

  1. 按兩下 [下載],然後按兩下 [深入解析] (JSON)。

  2. 複製文字並貼到您的在線 JSON 查看器中。

    "keywords": [
      {
        "id": 1,
        "text": "office insider",
        "confidence": 1,
        "language": "en-US",
        "instances": [
          {
            "adjustedStart": "0:00:00",
            "adjustedEnd": "0:00:05.75",
            "start": "0:00:00",
            "end": "0:00:05.75"
          },
          {
            "adjustedStart": "0:01:21.82",
            "adjustedEnd": "0:01:24.7",
            "start": "0:01:21.82",
            "end": "0:01:24.7"
          },
          {
            "adjustedStart": "0:01:31.32",
            "adjustedEnd": "0:01:32.76",
            "start": "0:01:31.32",
            "end": "0:01:32.76"
          },
          {
            "adjustedStart": "0:01:35.8",
            "adjustedEnd": "0:01:37.84",
            "start": "0:01:35.8",
            "end": "0:01:37.84"
          }
        ]
      },
      {
        "id": 2,
        "text": "insider tip",
        "confidence": 0.9975,
        "language": "en-US",
        "instances": [
          {
            "adjustedStart": "0:01:14.91",
            "adjustedEnd": "0:01:19.51",
            "start": "0:01:14.91",
            "end": "0:01:19.51"
          }
        ]
      },
    
    

若要透過 API 下載 JSON 檔案,請使用 Azure AI 影片索引器開發人員入口網站

注意

關鍵詞擷取與語言無關。

關鍵字元件

在關鍵詞程式期間,會處理媒體檔案中的音訊和影像,如下所示:

元件 定義
來源語言 用戶上傳要編製索引的來源檔案。
轉譯 API 音訊檔案會傳送至 Azure AI 服務,並傳迴轉譯的轉譯輸出。 如果已指定語言,則會進行處理。
視訊的 OCR 媒體檔案中的影像會使用 Azure AI 視覺讀取 API 來處理,以擷取文字、其位置和其他見解。
關鍵詞擷取 擷取演算法會處理轉譯的音訊。 然後,結果會與 OCR 程式期間在影片中偵測到的深入解析結合。 關鍵詞及其出現在媒體的位置,然後偵測並識別。
信賴等級 每個關鍵詞的估計信賴等級會計算為 0 到 1 的範圍。 信賴分數代表結果精確度的確定性。 例如,82% 的確定性會以 0.82 分數表示。

範例使用案例

  • 將關鍵詞個人化以符合客戶利益,例如有關英格蘭的網站張貼有關英國電影或節日的促銷。
  • 深入搜尋封存以深入瞭解特定關鍵詞,以建立公司、人物或技術等功能故事,例如通訊社。

選擇使用案例時的考慮和限制

以下是使用關鍵詞擷取時請記住的一些考慮:

  • 上傳檔案時,一律使用高品質的視訊內容。 建議的最大畫面大小是 HD,幀速率為 30 FPS。 框架不應包含超過10人。 從影片輸出畫面到 AI 模型時,僅每秒傳送大約 2 或 3 個畫面格。 處理10個以上的畫面可能會延遲 AI 結果。
  • 上傳檔案時,一律使用高品質的音訊和視訊內容。 至少需要 1 分鐘的自發對話式語音才能執行分析。 音訊效果只會在非語音區段中偵測到。 非語音區段的最小持續時間為2秒。 不支援語音命令和唱歌。 

當負責任且謹慎地使用關鍵詞時,是許多產業的寶貴工具。 若要尊重他人的隱私權和安全性,以及遵守當地和全球法規,我們建議下列各項:

  • 一律尊重個人的隱私權,並只內嵌媒體以合法和合理的目的。  
  • 不要故意披露不適當的媒體,顯示年幼的孩子或名人的家庭成員或其他可能有害或對個人個人自由構成威脅的內容。  
  • 致力於在分析媒體的設計和部署中尊重和促進人權。  
  • 使用第三方數據時,在發佈衍生自它們的內容之前,請注意任何現有的著作權或許可權。 
  • 使用來自不明來源的媒體時,總是尋求法律建議。 
  • 請務必取得適當的法律和專業建議,以確保上傳的媒體受到保護,並擁有適當的控制,以保留內容的完整性,並防止未經授權的存取。    
  • 提供意見反應通道,可讓用戶和個人回報服務的問題。  
  • 請注意您區域中任何有關處理、分析和共用包含人員之媒體的適用法律或法規。 
  • 將人類保留在迴圈中。 請勿使用任何解決方案來取代人為監督和決策。  
  • 完整檢查並檢閱您用來瞭解其功能和限制的任何 AI 模型的潛力。