以文字為基礎的表情偵測

發行項
03/23/2024

重要

由於 Azure 媒體服務淘汰公告，Azure AI 影片索引器會宣告 Azure AI 影片索引器功能調整。請參閱 Azure 媒體服務（AMS）淘汰的相關變更，以瞭解 Azure AI 影片索引器帳戶的意義。請參閱準備AMS淘汰：VI更新和移轉指南。

表情偵測是 Azure AI 影片索引器 AI 功能，可自動偵測影片文字記錄行中的表情。每個句子都可以偵測為：

憤怒，
恐懼，
歡樂，
傷心

或者，如果沒有偵測到其他情緒，則上述任何內容都沒有。

此模型僅適用於文字（在視訊文字記錄中標記表情）。這種模型不會推斷人的情感狀態，可能不會執行輸入模棱兩可或不清楚的地方，如諷刺言論。因此，模型不應該用於評估員工績效或個人情緒狀態等專案。

一般準則

決定如何使用和實作 AI 支援的功能時，需要考慮許多事項：

這項功能是否會在我的案例中表現良好？在將表情偵測部署到您的案例之前，請先測試其如何使用實際數據執行，並確定它可以提供您需要的正確性。
我們是否有能力識別和因應錯誤？ AI 支援的產品和功能並不精確 100%，請考慮如何識別並回應可能發生的任何錯誤。

檢視深入解析

在網站上工作時，深入解析會顯示在 [ 深入解析 ] 索引卷標中。它們也可以在 JSON 檔案的分類清單中產生，其中包含標識碼、類型和其出現實例清單，以及其時間和信賴度。

若要在 JSON 檔案中顯示實體，請執行下列動作：

選取 [下載 -> 深入解析] （JSON）。
複製文字並貼到在線 JSON 查看器中。

"emotions": [ 
  { 
    "id": 1, 
    "type": "Sad", 
    "instances": [ 
      { 
        "confidence": 0.5518, 
        "adjustedStart": "0:00:00", 
        "adjustedEnd": "0:00:05.75", 
        "start": "0:00:00", 
        "end": "0:00:05.75" 
      },

若要透過 API 下載 JSON 檔案，請使用 Azure AI 影片索引器開發人員入口網站。

注意

以文字為基礎的表情偵測與語言無關，但如果文字記錄不是英文，則會先翻譯成英文，然後才套用模型。這可能會導致非英文的表情偵測精確度降低。

表情偵測元件

在表情偵測程式期間，會處理影片的文字記錄，如下所示：

元件	定義
來源語言	用戶上傳要編製索引的來源檔案。
轉譯 API	音訊檔案會傳送至 Azure AI 服務，並傳迴轉譯的轉譯輸出。如果已指定語言，則會處理它。
表情偵測	每個句子都會傳送至表情偵測模型。模型會產生每個表情的信賴等級。如果信賴等級超過特定閾值，且正面和負面情緒之間沒有模棱兩可，則會偵測到該情緒。在任何其他情況下，句子會標示為中性。
信賴等級	偵測到情緒的估計信賴等級會計算為 0 到 1 的範圍。信賴分數代表結果精確度的確定性。例如，82% 的確定性會以 0.82 分數表示。

輸入數據的考慮和限制

以下是使用表情偵測時請記住的一些考慮：

上傳檔案時，一律使用高品質的音訊和視訊內容。

當使用負責任且謹慎的情緒偵測時，是許多產業的寶貴工具。若要尊重他人的隱私權和安全性，以及遵守當地和全球法規，我們建議下列各項：

一律尊重個人的隱私權，並只內嵌媒體以合法和合理的目的。  
不要故意披露不適當的媒體，顯示年幼的孩子或名人的家庭成員或其他可能有害或對個人個人自由構成威脅的內容。  
致力於在分析媒體的設計和部署中尊重和促進人權。  
使用第三方數據時，在發佈衍生自它們的內容之前，請注意任何現有的著作權或許可權。 
使用來自不明來源的媒體時，總是尋求法律建議。 
請務必取得適當的法律和專業建議，以確保上傳的媒體受到保護，並擁有適當的控制，以保留內容的完整性，並防止未經授權的存取。    
提供意見反應通道，可讓用戶和個人回報服務的問題。  
請注意您區域中任何有關處理、分析和共用包含人員之媒體的適用法律或法規。 
將人類保留在迴圈中。請勿使用任何解決方案來取代人為監督和決策。  
完整檢查並檢閱您用來瞭解其功能和限制的任何 AI 模型的潛力。 
完整檢查並檢閱您用來瞭解其功能和限制的任何 AI 模型的潛力。

透明度附註

一般

檢閱透明度附注概觀

表情偵測特定

簡介：此模型旨在協助偵測影片文字記錄中的表情。不過，它不適合對個人情緒狀態、能力或整體表現進行評估。

使用案例：此表情偵測模型旨在協助判斷影片文字記錄中句子背後的情感。不過，它只適用於文字本身，而且對於諷刺輸入或輸入可能模棱兩可或不清楚的情況，可能無法正常執行。

資訊需求：若要提高此模型的精確度，建議輸入數據採用清楚且明確的格式。使用者也應該注意，此模型沒有輸入數據的內容，這可能會影響其精確度。

限制：此模型可以同時產生誤判和誤判。若要降低兩者的可能性，建議使用者遵循輸入數據和前置處理的最佳作法，並在其他相關信息的內容中解譯輸出。請務必注意，系統沒有任何輸入數據的內容。

解譯：此模型的輸出不應用來評估個人的情感狀態或其他人類特徵。此模型以英文支援，且可能無法以非英文輸入正常運作。非英文輸入在輸入模型之前會轉譯成英文，因此可能會產生較不精確的結果。

預定的使用案例

內容建立者和影片編輯器 - 內容建立者和視訊編輯器可以使用系統來分析其影片文字記錄中所表達的情緒。這有助於他們深入瞭解其內容的情感基調，讓他們微調敘事、調整步調，或確保對觀眾的預期情感影響。
媒體分析師和研究人員 - 媒體分析師和研究人員可以使用該系統，快速分析大量視頻文字記錄的情感內容。他們可以使用系統所產生的情感時間軸來識別特定主題或感興趣的領域的趨勢、模式或情感回應。
營銷和廣告專業人員 - 行銷和廣告專業人員可以利用系統來評估其營銷活動或視頻廣告的情感接收。瞭解其內容所引發的情緒，有助於他們更有效地量身打造資訊，並衡量其營銷活動的成功。
影片取用者和查看器 - 使用者，例如視訊內容的觀眾或取用者，可以藉由瞭解影片的情感內容而不需完全觀看，來受益於系統。這特別適用於想要決定影片是否值得觀看的使用者，或對於有有限時間的閑置時間的使用者。
娛樂產業專業人員 - 娛樂業的專業人員，例如電影製作人或導演，可以利用該系統來衡量其電影劇本或故事情節的情感影響，協助劇本精簡和觀眾參與。

選擇其他使用案例時的考慮

模型不應該用來評估員工績效和監視個人。
模型不應該用於對某人、情緒狀態或能力進行評估。
模型的結果可能不正確，因為這是 AI 系統，因此應謹慎處理。
模型在預測中的信賴度也應該納入考慮。
非英文影片會產生較不精確的結果。

Share via