推論に関するトピックの分析情報を取得する

2025-06-09

トピック推論は、変換されたオーディオ、ビジュアルテキスト内の OCR コンテンツ、および Video Indexer 顔認識モデルがビデオで認識する著名人から推論された分析情報を作成します。

Web ポータルの [分析情報] タブには、抽出されたトピックとカテゴリ (使用可能な場合) が一覧表示されます。メディアファイル内のトピックにジャンプするには、[トピック] -> [前に再生] または [次に再生] を選択します。

トピック推論のユースケース

英語の映画やフェスティバルに関するイングランドの投稿プロモーションの Web サイトなど、トピックの推定を使用して顧客の関心に合わせてパーソナル化を行う。
特定のテーマについての洞察を得るためにアーカイブを深く検索し、企業、人物、または技術に関する特集記事を作成します。たとえば、報道機関によって実施されることがあります。
抽出された分析情報の価値を高めて、収益化につなげる。たとえば、広告収益に依存するニュースやソーシャルメディアなどの業界では、抽出された分析情報を他のシグナルとして広告サーバーに使用することで、関連する広告を配信できます。

Web ポータルで分析情報 JSON を表示する

ビデオをアップロードしてインデックスを作成したら、Web ポータルから JSON 形式で分析情報をダウンロードします。

Library タブを選択します。
目的のメディアを選択します。
[ ダウンロード] を選択し、[ Insights (JSON)] を選択します。 JSON ファイルが新しいブラウザータブで開きます。
応答例で説明されているキーペアを見つけます。

API の使用

ビデオインデックスの取得要求を使用します。 &includeSummarizedInsights=falseを渡す。
次の応答例で説明されているキーペアを見つけます。

応答の例

    "topics": [
      {
        "id": 1,
        "name": "Pens",
        "referenceId": "Category:Pens",
        "referenceUrl": "https://en.wikipedia.org/wiki/Category:Pens",
        "referenceType": "Wikipedia",
        "confidence": 0.6833,
        "iabName": null,
        "language": "en-US",
        "instances": [
          {
            "adjustedStart": "0:00:30",
            "adjustedEnd": "0:01:17.5",
            "start": "0:00:30",
            "end": "0:01:17.5"
          }
        ]
      },
      {
        "id": 2,
        "name": "Musical groups",
        "referenceId": "Category:Musical_groups",
        "referenceUrl": "https://en.wikipedia.org/wiki/Category:Musical_groups",
        "referenceType": "Wikipedia",
        "confidence": 0.6812,
        "iabName": null,
        "language": "en-US",
        "instances": [
          {
            "adjustedStart": "0:01:10",
            "adjustedEnd": "0:01:17.5",
            "start": "0:01:10",
            "end": "0:01:17.5"
          }
        ]
      },

重要

すべてのVI機能の透明度に関する注意事項の概要をお読みください。各分析情報には、独自の透明性に関するメモもあります。

トピック推論に関する注意事項

ファイルをアップロードするときは、常に高品質のビデオコンテンツを使用します。推奨される最大フレームサイズは HD で、フレームレートは 30 FPS です。 1 つのフレームに含まれる人物は 10 人以下にする必要があります。ビデオから AI モデルにフレームを出力する場合は、1 秒あたり約 2 つまたは 3 つのフレームのみを送信します。 10 個以上のフレームを処理すると、AI の結果が遅れる可能性があります。
ファイルをアップロードするときは、常に高品質の音声およびビデオコンテンツを使用します。分析を実行するには、1 分以上の自然な会話音声が必要です。オーディオ効果は、非音声セグメントでのみ検出されます。非音声区間の最小持続時間は2秒です。音声コマンドや歌はサポートされていません。
通常、200 ピクセル未満の小さなユーザーまたはオブジェクトと、座っているユーザーは検出されない場合があります。同じような服や制服を着ている人は、同じ人物として検出され、同じID番号が与えられる可能性があります。妨害されたユーザーまたはオブジェクトが検出されない可能性があります。前向きと後ろ向きでポーズを取る人のトラックは、異なるインスタンスに分割される場合があります。

トピック推論コンポーネント

コンポーネント	定義
ソース言語	ユーザーは、インデックス作成のためにソースファイルをアップロードします。
前処理中	文字起こし、OCR、顔認識 API は、メディアファイルから分析情報を抽出します。
分析情報の処理	トピック AI は、前処理中に抽出された文字起こし、OCR、顔認識の分析情報を分析します。 - 書き起こされたテキスト、書き起こされたテキストの行ごとの分析情報が、オントロジベースの AI テクノロジを使用して調べられます。 - OCR と顔認識の分析情報は、オントロジベースの AI テクノロジを使用して一緒に調べられます。
後処理	- 書き起こされたテキスト、分析情報が抽出され、書き起こされたテキストの行番号と共にトピックカテゴリに関連付けられます。例: 政治、7 行目。 - OCR と顔認識、各分析情報が、メディアファイル内のトピックのインスタンスの時刻と共にトピックカテゴリに関連付けられます。例: Freddie Mercury、人物および音楽カテゴリ、20.00。
信頼度値	各トピックの推定信頼度レベルは、0 から 1 の範囲として計算されます。信頼度スコアは、結果の精度の確実性を表しています。たとえば、82% の確実性はスコア 0.82 として表されます。

サンプルコード

VIのすべてのサンプルを見る

Azure AI Video Indexer のドキュメント

次の方法で共有

推論に関するトピックの分析情報を取得する

トピック推論のユース ケース

Web ポータルで分析情報 JSON を表示する

API の使用

応答の例

トピック推論に関する注意事項

トピック推論コンポーネント

サンプル コード

関連コンテンツ

フィードバック

その他のリソース

トピック推論のユースケース

サンプルコード