Azure AI Video Indexer の出力を調べる

重要

Azure Media Services の 提供終了の発表により、Azure AI Video Indexer は Azure AI Video Indexer の 機能の調整を発表します。 Azure AI Video Indexer アカウントの意味を理解するには、Azure Media Service (AMS) の提供終了に関連する変更に関するページを参照してください。 AMS 提供 終了の準備: VI の更新と移行に関するガイドを参照してください。

ビデオにインデックスを付けると、Azure AI Video Indexer によって、指定されたビデオの分析情報の詳細を含む JSON コンテンツが生成されます。 分析情報には、トランスクリプト、光学式文字認識要素 (OCR)、顔、トピックなどの詳細が含まれます。 各種の分析情報には、その分析情報がビデオにいつ現れたかを示す時間範囲のインスタンスが含まれます。

詳細については、Azure AI Video Indexer の分析情報に関するページを参照してください。

分析情報のルート要素

名前 説明
accountId プレイリストの VI アカウント ID
id プレイリストの ID
name プレイリストの名前
description プレイリストの説明
userName プレイリストを作成したユーザーの名前
created プレイリストの作成時刻
privacyMode プレイリストのプライバシー モード (Private または Public)。
state プレイリストの状態 (UploadedProcessingProcessedFailed、または Quarantined)。
isOwned 現在のユーザーがプレイリストを作成したかどうかを示します。
isEditable 現在のユーザーにプレイリストを編集する権限があるかどうかを示します。
isBase プレイリストがベースのプレイリスト (ビデオ) か、他のビデオによって構成されたプレイリスト (派生) かどうかを示します。
durationInSeconds プレイリストの合計期間
summarizedInsights 生成された JSON 出力には、InsightsSummarizedInsights の要素が含まれます。 Insights を使用し、SummarizedInsights (後方互換対応のために存在します) は使用しないことをお勧めします。
videos プレイリストを構成するビデオの一覧。
プレイリストが他のビデオの時間範囲で構成されている場合 (派生)、この一覧のビデオには、含まれる時間範囲からのデータのみが含まれます。
{
  ...
  "accountId": "00000000-0000-0000-0000-000000000000",
  "id": "abc3454321",
  "name": "My first video",
  "description": "I am trying VI",
  "userName": "Some name",
  "created": "2018/2/2 18:00:00.000",
  "privacyMode": "Private",
  "state": "Processed",
  "isOwned": true,
  "isEditable": false,
  "isBase": false,
  "durationInSeconds": 120, 
  "summarizedInsights" : null,
  "videos": [{ . . . }]
}

ヒント

生成された JSON 出力には、InsightsSummarizedInsights の要素が含まれます。 Insights を使用し、SummarizedInsights (後方互換対応のために存在) は使用しないことを強くお勧めします。

分析情報の概要

このセクションには、分析情報の概要が表示されます。

属性 説明
name ビデオの名前。 (例: Azure Monitor)。
id ビデオの ID (例: 63c6d532ff)。
privacyMode 内訳には次のいずれかのモードがあります。Public ビデオは、アカウント内のすべてのユーザーと、ビデオへのリンクを持っているすべてのユーザーに表示されます。 Private ビデオは、アカウント内のすべてのユーザーに表示されます。
duration 分析情報が発生した時間 (秒単位)。
thumbnailVideoId サムネイルの取得元のビデオの ID。
thumbnailId ビデオのサムネイル ID。 実際のサムネイルを取得するには、Get-Thumbnail を呼び出し、thumbnailVideoIdthumbnailId を渡します。
faces 0 個以上の顔を含めます。 詳細については、「」を参照してください。
keywords 0 個以上のキーワードを含めます。 詳細については、「keywords」を参照してください。
sentiments 0 個以上のセンチメントを含めます。 詳細については、「sentiments」を参照してください。
audioEffects 0 個以上のオーディオ エフェクトを含めます。 詳細については、「audioEffects」を参照してください。
labels 0 個以上のラベルを含めます。 詳細については、「labels」を参照してください。
brands 0 個以上のブランドを含めます。 詳細については、「brands」を参照してください。
statistics 詳細については、「統計」を参照してください。
emotions 0 個以上の感情を含めます。 詳細については、「emotions」を参照してください。
topics 0 個以上のトピックを含めます。 詳細については、「topics」を参照してください。

ビデオ

名前 説明
accountId ビデオの VI アカウント ID
id ビデオの ID
name ビデオの名前
state ビデオの状態 (UploadedProcessingProcessedFailed、または Quarantined)。
processingProgress 処理中の進行状況。 (例: 20%)。
failureCode ビデオの処理に失敗した場合のエラー コード。 (例: UnsupportedFileType)。
failureMessage ビデオの処理に失敗した場合のエラー メッセージ。
externalId ビデオの外部 ID (ユーザーが指定した場合)。
externalUrl ビデオの外部 URL (ユーザーが指定した場合)。
metadata ビデオの外部メタデータ (ユーザーが指定した場合)。
isAdult ビデオが手動でレビューされ、成人向けビデオとして識別されたかどうかを示します。
insights 分析情報オブジェクト 詳細については、「分析情報」を参照してください。
thumbnailId ビデオのサムネイル ID。 実際のサムネイルを取得するには、Get-Thumbnail を呼び出し、ビデオ ID とサムネイル ID に渡します。
publishedUrl ビデオをストリーミングする URL。
publishedUrlProxy Apple デバイス上のビデオをストリーミングする URL。
viewToken ビデオ ストリーミング用の短命表示トークン。
sourceLanguage ビデオのソース言語
language ビデオの実際の言語 (翻訳)
indexingPreset ビデオのインデックス付けに使用するプリセット
streamingPreset ビデオの発行に使用するプリセット
linguisticModelId ビデオの文字起こしに使われるトランスクリプト カスタマイズ (CRIS) モデル。
statistics 詳細については、「統計」を参照してください。
{
    "videos": [{
        "accountId": "2cbbed36-1972-4506-9bc7-55367912df2d",
        "id": "142a356aa6",
        "state": "Processed",
        "privacyMode": "Private",
        "processingProgress": "100%",
        "failureCode": "General",
        "failureMessage": "",
        "externalId": null,
        "externalUrl": null,
        "metadata": null,
        "insights": {. . . },
        "thumbnailId": "89d7192c-1dab-4377-9872-473eac723845",
        "publishedUrl": "https://videvmediaservices.streaming.mediaservices.windows.net:443/d88a652d-334b-4a66-a294-3826402100cd/Xamarine.ism/manifest",
        "publishedProxyUrl": null,
        "viewToken": "Bearer=<token>",
        "sourceLanguage": "En-US",
        "language": "En-US",
        "indexingPreset": "Default",
        "linguisticModelId": "00000000-0000-0000-0000-000000000000"
    }],
}

インサイト

各分析情報 (トランスクリプト行、顔、ブランドなど) には、一意の要素の一覧 (face1face2face3 など) が含まれています。 各要素には、独自のメタデータと、追加のメタデータを含む時間範囲であるインスタンスの一覧があります。

顔には、ID、名前、サムネイル、その他のメタデータ、およびそのテンポラル インスタンスの一覧 (たとえば、00:00:05 – 00:00:1000:01:00 - 00:02:3000:41:21 – 00:41:49) がある場合があります。 各テンポラル インスタンスは、追加のメタデータを持つことができます。 たとえば、メタデータには、顔の四角形の座標 (20,230,60,60) を含めることができます。

Version コードのバージョン
sourceLanguage BCP-47 文字列形式の (1 つのマスター言語を想定した) ビデオのソース言語。
language BCP-47 文字列形式の (ソース言語から翻訳された) 分析情報言語。
transcript transcript 分析情報。
ocr OCR 分析情報。
keywords keywords 分析情報。
transcripts 1 つ以上の transcript が含まれている場合があります。
faces faces 分析情報。
labels labels 分析情報。
shots shots 分析情報。
brands brands 分析情報。
audioEffects audioEffects 分析情報。
sentiments sentiments 分析情報。
visualContentModeration visualContentModeration 分析情報。
textualContentModeration textualContentModeration 分析情報。
emotions emotions 分析情報。
topics topics 分析情報。
speakers speakers 分析情報。

例:

{
  "version": "0.9.0.0",
  "sourceLanguage": "en-US",
  "language": "es-ES",
  "transcript": ...,
  "ocr": ...,
  "keywords": ...,
  "faces": ...,
  "labels": ...,
  "shots": ...,
  "brands": ...,
  "audioEffects": ...,
  "sentiments": ...,
  "visualContentModeration": ...,
  "textualContentModeration": ...
}

transcript

名前 説明
id 行 ID。
text トランスクリプトそのもの。
confidence トランスクリプトの精度の信頼度レベル。
speakerId 話者の ID。
language トランスクリプトの言語。 各行の言語が異なる可能性があるトランスクリプトをサポートすることを目的としています。
instances この行が出現する時間範囲の一覧。 インスタンスがトランスクリプト内にある場合、インスタンスは 1 つだけです。

例:

"transcript":[
{
  "id":1,
  "text":"Well, good morning everyone and welcome to",
  "confidence":0.8839,
  "speakerId":1,
  "language":"en-US",
  "instances":[
     {
    "adjustedStart":"0:00:10.21",
    "adjustedEnd":"0:00:12.81",
    "start":"0:00:10.21",
    "end":"0:00:12.81"
     }
  ]
},
{
  "id":2,
  "text":"ignite 2016. Your mission at Microsoft is to empower every",
  "confidence":0.8944,
  "speakerId":2,
  "language":"en-US",
  "instances":[
     {
    "adjustedStart":"0:00:12.81",
    "adjustedEnd":"0:00:17.03",
    "start":"0:00:12.81",
    "end":"0:00:17.03"
     }
  ]
}

ocr

名前 説明
id OCR の行 ID。
text OCR のテキスト。
confidence 認識の信頼度。
language OCR の言語。
instances この OCR が出現する時間範囲の一覧 (同じ OCR が複数回出現する可能性があります)。
height OCR 四角形の高さ。
top 上部の位置 (ピクセル単位)。
left 左側の位置 (ピクセル単位)。
width OCR 四角形の幅。
angle OCR 四角形の角度 (-180 から 180)。 0 の値は左から右方向の水平を意味します。 90 の値は上から下方向の垂直を意味します。 180 の値は右から左方向の水平を意味します。 -90 の値は下から上方向の垂直を意味します。 30 の値は左上から右下方向を意味します。
"ocr": [
    {
      "id": 0,
      "text": "LIVE FROM NEW YORK",
      "confidence": 675.971,
      "height": 35,
      "language": "en-US",
      "left": 31,
      "top": 97,
      "width": 400,
      "angle": 30,
      "instances": [
        {
          "start": "00:00:26",
          "end": "00:00:52"
        }
      ]
    }
  ],

keywords

名前 説明
id キーワードの ID。
text キーワードのテキスト。
confidence キーワードの認識の信頼度。
language キーワードの言語 (翻訳時)。
instances このキーワードが出現した時間範囲の一覧 (1 つのキーワードが複数回出現する可能性があります)。
{
    id: 0,
    text: "technology",
    confidence: 1,
    language: "en-US",
    instances: [{
            adjustedStart: "0:05:15.782",
            adjustedEnd: "0:05:16.249",
            start: "0:05:15.782",
            end: "0:05:16.249"
    },
    {
            adjustedStart: "0:04:54.761",
            adjustedEnd: "0:04:55.228",
            start: "0:04:54.761",
            end: "0:04:55.228"
    }]
}

faces

顔がある場合、Azure AI Video Indexer では、ビデオのすべてのフレームで Face API を使用して顔と有名人が検出されます。

名前 説明
id 顔の ID。
name 顔の名前。 Unknown #0、識別された著名人、または顧客のトレーニング担当者の場合があります。
confidence 顔識別の信頼度レベル。
description 著名人の説明
thumbnailId その顔のサムネイルの ID
knownPersonId 既知の人物の場合は、内部 ID。
referenceId Bing に登録されている著名人の場合は、Bing ID。
referenceType 現時点では Bing のみ。
title 著名人の場合は、その人物のタイトル。 (例: Microsoft's CEO)。
imageUrl 著名人の場合は、画像の URL。
instances 時間範囲の中で顔が出現したインスタンス。 各インスタンスには thumbnailsIds 値もあります。
"faces": [{
    "id": 2002,
    "name": "Xam 007",
    "confidence": 0.93844,
    "description": null,
    "thumbnailId": "00000000-aee4-4be2-a4d5-d01817c07955",
    "knownPersonId": "8340004b-5cf5-4611-9cc4-3b13cca10634",
    "referenceId": null,
    "title": null,
    "imageUrl": null,
    "instances": [{
        "thumbnailsIds": ["00000000-9f68-4bb2-ab27-3b4d9f2d998e",
        "cef03f24-b0c7-4145-94d4-a84f81bb588c"],
        "adjustedStart": "00:00:07.2400000",
        "adjustedEnd": "00:00:45.6780000",
        "start": "00:00:07.2400000",
        "end": "00:00:45.6780000"
    },
    {
        "thumbnailsIds": ["00000000-51e5-4260-91a5-890fa05c68b0"],
        "adjustedStart": "00:10:23.9570000",
        "adjustedEnd": "00:10:39.2390000",
        "start": "00:10:23.9570000",
        "end": "00:10:39.2390000"
    }]
}]

ラベル

名前 説明
id ラベルの ID。
name ラベルの名前。 たとえば、ComputerTV などです。
language BCP-47 文字列形式のラベルの名前の言語 (翻訳済みの場合)。
instances このラベルが出現する時間範囲の一覧 (ラベルは複数回出現する場合があります)。各インスタンスには信頼度フィールドがあります。
"labels": [
    {
      "id": 0,
      "name": "person",
      "language": "en-US",
      "instances": [
        {
          "confidence": 1.0,
          "start": "00: 00: 00.0000000",
          "end": "00: 00: 25.6000000"
        },
        {
          "confidence": 1.0,
          "start": "00: 01: 33.8670000",
          "end": "00: 01: 39.2000000"
        }
      ]
    },
    {
      "name": "indoor",
      "language": "en-US",
      "id": 1,
      "instances": [
        {
          "confidence": 1.0,
          "start": "00: 00: 06.4000000",
          "end": "00: 00: 07.4670000"
        },
        {
          "confidence": 1.0,
          "start": "00: 00: 09.6000000",
          "end": "00: 00: 10.6670000"
        },
        {
          "confidence": 1.0,
          "start": "00: 00: 11.7330000",
          "end": "00: 00: 20.2670000"
        },
        {
          "confidence": 1.0,
          "start": "00: 00: 21.3330000",
          "end": "00: 00: 25.6000000"
        }
      ]
    }
  ] 

シーン

名前 説明
id シーンの ID。
instances このシーンの時間範囲の一覧 (1 つのシーンは 1 つのインスタンスのみを持つことができます)。
"scenes":[  
    {  
      "id":0,
      "instances":[  
          {  
            "start":"0:00:00",
            "end":"0:00:06.34",
            "duration":"0:00:06.34"
          }
      ]
    },
    {  
      "id":1,
      "instances":[  
          {  
            "start":"0:00:06.34",
            "end":"0:00:47.047",
            "duration":"0:00:40.707"
          }
      ]
    },

]

shots

名前 説明
id ショットの ID。
keyFrames ショット内のキーフレームの一覧。 ID と、インスタンスの時間範囲の一覧がそれぞれにあります。 各キーフレーム インスタンスには、キーフレームのサムネイル ID を保持する thumbnailId フィールドがあります。
instances このショットの時間範囲の一覧 (1 つのショットは 1 つのインスタンスのみを持つことができます)。
"shots":[  
    {  
      "id":0,
      "keyFrames":[  
          {  
            "id":0,
            "instances":[  
                {  
                  "thumbnailId":"00000000-0000-0000-0000-000000000000",
                  "start":"0:00:00.209",
                  "end":"0:00:00.251",
                  "duration":"0:00:00.042"
                }
            ]
          },
          {  
            "id":1,
            "instances":[  
                {  
                  "thumbnailId":"00000000-0000-0000-0000-000000000000",
                  "start":"0:00:04.755",
                  "end":"0:00:04.797",
                  "duration":"0:00:00.042"
                }
            ]
          }
      ],
      "instances":[  
          {  
            "start":"0:00:00",
            "end":"0:00:06.34",
            "duration":"0:00:06.34"
          }
      ]
    },

]

ブランド

Azure AI Video Indexer は、音声テキスト変換トランスクリプトとビデオ OCR 内のビジネスと製品のブランド名を検出します。 この情報には、ブランドまたはロゴ検出の画像認識は含まれません。

名前 説明
id ブランドの ID。
name ブランドの名前。
referenceId ブランドの Wikipedia URL のサフィックス。 たとえば、Target_Corporationhttps://en.wikipedia.org/wiki/Target_Corporation のサフィックスです。
referenceUrl そのブランドの Wikipedia の URL (存在する場合)。 (例: https://en.wikipedia.org/wiki/Target_Corporation)。
description ブランドの説明。
tags このブランドに関連付けられていた定義済みタグの一覧
confidence Azure AI Video Indexer のブランド検出機能の信頼度の値 (0-1)。
instances このブランドの時間範囲の一覧。 各インスタンスは、このブランドがトランスクリプトまたは OCR に表示されたかどうかを示す brandType 値を持ちます。
"brands": [
{
    "id": 0,
    "name": "MicrosoftExcel",
    "referenceId": "Microsoft_Excel",
    "referenceUrl": "http: //en.wikipedia.org/wiki/Microsoft_Excel",
    "referenceType": "Wiki",
    "description": "Microsoft Excel is a sprea..",
    "tags": [],
    "confidence": 0.975,
    "instances": [
    {
        "brandType": "Transcript",
        "start": "00: 00: 31.3000000",
        "end": "00: 00: 39.0600000"
    }
    ]
},
{
    "id": 1,
    "name": "Microsoft",
    "referenceId": "Microsoft",
    "referenceUrl": "http: //en.wikipedia.org/wiki/Microsoft",
    "description": "Microsoft Corporation is...",
    "tags": [
    "competitors",
    "technology"
    ],
    "confidence": 1.0,
    "instances": [
    {
        "brandType": "Transcript",
        "start": "00: 01: 44",
        "end": "00: 01: 45.3670000"
    },
    {
        "brandType": "Ocr",
        "start": "00: 01: 54",
        "end": "00: 02: 45.3670000"
    }
    ]
}
]

statistics

名前 説明
CorrespondenceCount ビデオ内の通知の数。
SpeakerWordCount 話者あたり単語の数
SpeakerNumberOfFragments ビデオ内で話者が持っているフラグメント数。
SpeakerLongestMonolog 話者の最も長いモノローグ。 モノローグでの話者の沈黙がある場合、それも含まれます。 モノローグの先頭と末尾の無音は削除されます。
SpeakerTalkToListenRatio 計算は、ビデオの合計時間で割られた話者のモノローグに費やされた時間に基づきます (間の無音は含みません)。 時間は、小数点第 3 位に丸められます。

audioEffects (プレビュー)

名前 説明
id オーディオ エフェクトの ID。
type オーディオ エフェクトの種類。
name JSON のインデックスが作成された言語でのオーディオ エフェクトの種類。
instances このオーディオ エフェクトが出現する時間範囲の一覧。 各インスタンスに confidence フィールドがあります。
start + end 元のビデオの時間の範囲。
adjustedStart + adjustedEnd 時間範囲と調整された時間範囲
audioEffects: [{
 {
        id: 0,
        type: "Laughter",
        name: "Laughter",
        instances: [{
                confidence: 0.8815,
                adjustedStart: "0:00:10.2",
                adjustedEnd: "0:00:11.2",
                start: "0:00:10.2",
                end: "0:00:11.2"
            }, {
                confidence: 0.8554,
                adjustedStart: "0:00:48.26",
                adjustedEnd: "0:00:49.56",
                start: "0:00:48.26",
                end: "0:00:49.56"
            }, {
                confidence: 0.8492,
                adjustedStart: "0:00:59.66",
                adjustedEnd: "0:01:00.66",
                start: "0:00:59.66",
                end: "0:01:00.66"
            }
        ]
    }
],

sentiments

センチメントは sentimentType フィールドで集計されます (PositiveNeutral、または Negative)。 例: 0-0.1, 0.1-0.2

名前 説明
id センチメントの ID。
averageScore センチメントの種類が同じすべてのインスタンスのすべてのスコアの平均値。
instances このセンチメントが出現する時間範囲の一覧。
sentimentType 種類には PositiveNeutral、または Negative を指定できます。
"sentiments": [
{
    "id": 0,
    "averageScore": 0.87,
    "sentimentType": "Positive",
    "instances": [
    {
        "start": "00:00:23",
        "end": "00:00:41"
    }
    ]
}, {
    "id": 1,
    "averageScore": 0.11,
    "sentimentType": "Positive",
    "instances": [
    {
        "start": "00:00:13",
        "end": "00:00:21"
    }
    ]
}
]

visualContentModeration

visualContentModeration トランスクリプトには、Azure AI Video Indexer によって成人向けコンテンツが含まれる可能性があると判断された時間帯が含まれています。 visualContentModeration が空の場合、成人向けコンテンツは識別されません。

成人向けまたはわいせつなコンテンツを含むビデオでは、プライベート ビューしか利用できない場合があります。 ユーザーは、人間によるコンテンツのレビューに関する要求を送信できます。 その場合、IsAdult 属性には人間によるレビューの結果が格納されます。

名前 説明
id ビジュアル コンテンツ モデレーションの ID。
adultScore (コンテンツ モデレーションからの) 成人スコア。
racyScore (コンテンツ モデレーションからの) わいせつスコア
instances このビジュアル コンテンツ モデレーションが発生した時間範囲の一覧

visualContentModeration の詳細を確認する

"visualContentModeration": [
{
    "id": 0,
    "adultScore": 0.00069,
    "racyScore": 0.91129,
    "instances": [
    {
        "start": "00:00:25.4840000",
        "end": "00:00:25.5260000"
    }
    ]
},
{
    "id": 1,
    "adultScore": 0.99231,
    "racyScore": 0.99912,
    "instances": [
    {
        "start": "00:00:35.5360000",
        "end": "00:00:35.5780000"
    }
    ]
}
] 

textualContentModeration

名前 説明
id テキスト コンテンツ モデレーションの ID。
bannedWordsCount 禁止された単語の数
bannedWordsRatio 単語の合計数に対する禁止された単語の比率。
textualContentModeration の詳細を確認する

emotions

Azure AI Video Indexer では、音声とオーディオの手掛かりに基づいて感情を識別します。

名前 説明
id 感情の ID。
type 識別されたセンチメントの種類: JoySadnessAnger、または Fear
instances この感情が出現した時間範囲の一覧。
"emotions": [{
    "id": 0,
    "type": "Fear",
    "instances": [{
      "adjustedStart": "0:00:39.47",
      "adjustedEnd": "0:00:45.56",
      "start": "0:00:39.47",
      "end": "0:00:45.56"
    },
    {
      "adjustedStart": "0:07:19.57",
      "adjustedEnd": "0:07:23.25",
      "start": "0:07:19.57",
      "end": "0:07:23.25"
    }]
  },
  {
    "id": 1,
    "type": "Anger",
    "instances": [{
      "adjustedStart": "0:03:55.99",
      "adjustedEnd": "0:04:05.06",
      "start": "0:03:55.99",
      "end": "0:04:05.06"
    },
    {
      "adjustedStart": "0:04:56.5",
      "adjustedEnd": "0:05:04.35",
      "start": "0:04:56.5",
      "end": "0:05:04.35"
    }]
  },
  {
    "id": 2,
    "type": "Joy",
    "instances": [{
      "adjustedStart": "0:12:23.68",
      "adjustedEnd": "0:12:34.76",
      "start": "0:12:23.68",
      "end": "0:12:34.76"
    },
    {
      "adjustedStart": "0:12:46.73",
      "adjustedEnd": "0:12:52.8",
      "start": "0:12:46.73",
      "end": "0:12:52.8"
    },
    {
      "adjustedStart": "0:30:11.29",
      "adjustedEnd": "0:30:16.43",
      "start": "0:30:11.29",
      "end": "0:30:16.43"
    },
    {
      "adjustedStart": "0:41:37.23",
      "adjustedEnd": "0:41:39.85",
      "start": "0:41:37.23",
      "end": "0:41:39.85"
    }]
  },
  {
    "id": 3,
    "type": "Sad",
    "instances": [{
      "adjustedStart": "0:13:38.67",
      "adjustedEnd": "0:13:41.3",
      "start": "0:13:38.67",
      "end": "0:13:41.3"
    },
    {
      "adjustedStart": "0:28:08.88",
      "adjustedEnd": "0:28:18.16",
      "start": "0:28:08.88",
      "end": "0:28:18.16"
    }]
  }
],

topics

Azure AI Video Indexer では、トランスクリプトから主なトピックを推論します。 可能な場合は、第 2 レベルの IPTC 分類が含まれています。

名前 説明
id トピックの ID。
name トピックの名前。 (例: Pharmaceuticals)。
referenceId トピックの階層を反映する階層リンク。 (例: HEALTH AND WELLBEING/MEDICINE AND HEALTHCARE/PHARMACEUTICALS)。
confidence 範囲が 0-1 の信頼度スコア。 高いほど信頼度が高くなります。
language トピックで使用されている言語。
iptcName IPTC メディア コード名 (検出された場合)。
instances 現在、Azure AI Video Indexer では、トピックの時間間隔にインデックスを付けません。 ビデオ全体が間隔として使用されます。
"topics": [{
    "id": 0,
    "name": "INTERNATIONAL RELATIONS",
    "referenceId": "POLITICS AND GOVERNMENT/FOREIGN POLICY/INTERNATIONAL RELATIONS",
    "referenceType": "VideoIndexer",
    "confidence": 1,
    "language": "en-US",
    "instances": [{
        "adjustedStart": "0:00:00",
        "adjustedEnd": "0:03:36.25",
        "start": "0:00:00",
        "end": "0:03:36.25"
    }]
}, {
    "id": 1,
    "name": "Politics and Government",
    "referenceType": "VideoIndexer",
    "iptcName": "Politics",
    "confidence": 0.9041,
    "language": "en-US",
    "instances": [{
        "adjustedStart": "0:00:00",
        "adjustedEnd": "0:03:36.25",
        "start": "0:00:00",
        "end": "0:03:36.25"
    }]
}]
. . .

speakers

名前 説明
id 話者の ID。
name Speaker #<number> 形式の話者の名前。 (例: Speaker #1)。
instances この話者が出現した時間範囲の一覧。
"speakers":[
{
  "id":1,
  "name":"Speaker #1",
  "instances":[
     {
    "adjustedStart":"0:00:10.21",
    "adjustedEnd":"0:00:12.81",
    "start":"0:00:10.21",
    "end":"0:00:12.81"
     }
  ]
},
{
  "id":2,
  "name":"Speaker #2",
  "instances":[
     {
    "adjustedStart":"0:00:12.81",
    "adjustedEnd":"0:00:17.03",
    "start":"0:00:12.81",
    "end":"0:00:17.03"
     }
  ]
},