共用方式為


檢視及更新謄寫

本文說明如何在 Azure AI Video Indexer 網站中插入或移除文字記錄行。 其也會顯示如何檢視文字層級資訊。

在 Azure AI Video Indexer 網站中插入或移除文字記錄行

本文說明如何在 Azure AI Video Indexer 網站中插入或移除文字記錄行。

將新行新增至文字記錄時間表

在編輯模式中,暫留在兩行謄寫之間。 您會在文字記錄行的結束時間與下列文字記錄行的開頭之間發現間距,使用者應該會看到下列 [add new transcription line] \(新增謄寫行\) 選項。

如何新增轉譯的螢幕快照。

按一下 [add new transcription line] \(新增謄寫行\) 之後,將會有一個選項可新增新文字及新行的時間戳記。 輸入文字,選擇新行的時間戳記,然後選取 [儲存]。 預設時間戳記是上一個謄寫行與下一個謄寫行之間的間距。

新文字記錄時間戳行的螢幕快照。

若沒有新增行的選項,您可以調整相關文字記錄行的結束/開始時間,以在您想要的位置填入新行。

在文字記錄行中選擇現有的行,按一下三個點圖示,選取 [編輯] 並據以變更時間戳記。

注意

新行不會顯示為語言下 [Content model customization] \(內容模型自訂\) 之 [From transcript edits] \(從文字記錄編輯\) 的一部分。

使用 API 新增行時,可以使用自由文字來新增說話者名稱。 例如,「演講者 1」現在可以變成 Adam

編輯現有的行

在編輯模式中,選取三個點圖示。 編輯選項已增強,現在不僅包含文字,也包含精確度為毫秒的時間戳記。

刪除一行

現在可以透過相同的三個點圖示刪除行。

將兩行合併為一行

若要將兩行合併,您認為應該顯示為一行。

  1. 移至第 2 行,選取 [編輯]。
  2. 複製文字
  3. 刪除行
  4. 移至第 1 行,編輯,貼上文字並儲存。

檢查文字層級謄寫資訊

本節顯示如何根據 Azure AI Video Indexer 所識別的句子與片語來檢查文字層級謄寫資訊。 每個片語會細分成單字,而且每個單字都有下列與其建立關聯的資訊

名稱 描述: 範例
Word 片語中的單字。 "thanks"
信賴度 Azure AI Video Indexer 對於單字正確具有多少信心。 0.80127704
位移 從影片開頭到文字開始位置的時間位移。 PT0.86S
期間 單字的持續時間。 PT0.28S

取得及檢視文字記錄

  1. 登入 Azure AI Video Indexer 網站
  2. 選取影片。
  3. 在右上角按向下箭號,然後選取 [Artifacts (ZIP)] \(成品 (ZIP)\)
  4. 下載成品。
  5. 解壓縮下載的檔案並瀏覽至解壓縮檔案所在的位置,然後尋找並開啟 transcript.speechservices.json
  6. 格式化並檢視 JSON。
  7. 尋找 RecognizedPhrases>NBest>Words 並尋找您感興趣的資訊。
"RecognizedPhrases": [
{
  "RecognitionStatus": "Success",
  "Channel": 0,
  "Speaker": 1,
  "Offset": "PT0.86S",
  "Duration": "PT11.01S",
  "OffsetInTicks": 8600000,
  "DurationInTicks": 110100000,
  "NBest": [
    {
      "Confidence": 0.82356554,
      "Lexical": "thanks for joining ...",
      "ITN": "thanks for joining ...",
      "MaskedITN": "",
      "Display": "Thanks for joining ...",
      "Words": [
        {
          "Word": "thanks",
          "Confidence": 0.80127704,
          "Offset": "PT0.86S",
          "Duration": "PT0.28S",
          "OffsetInTicks": 8600000,
          "DurationInTicks": 2800000
        },
        {
          "Word": "for",
          "Confidence": 0.93965703,
          "Offset": "PT1.15S",
          "Duration": "PT0.13S",
          "OffsetInTicks": 11500000,
          "DurationInTicks": 1300000
        },
        {
          "Word": "joining",
          "Confidence": 0.97060966,
          "Offset": "PT1.29S",
          "Duration": "PT0.31S",
          "OffsetInTicks": 12900000,
          "DurationInTicks": 3100000
        },
        {