次の方法で共有


推論に関するトピックの分析情報を取得する

トピック推論は、変換されたオーディオ、ビジュアル テキスト内の OCR コンテンツ、および Video Indexer 顔認識モデルがビデオで認識する著名人から推論された分析情報を作成します。

Web ポータルの [分析情報] タブには、抽出されたトピックとカテゴリ (使用可能な場合) が一覧表示されます。メディア ファイル内のトピックにジャンプするには、[トピック] -> [前に再生] または [次に再生] を選択します。

トピック推論のユース ケース

  • 英語の映画やフェスティバルに関するイングランドの投稿プロモーションの Web サイトなど、トピックの推定を使用して顧客の関心に合わせてパーソナル化を行う。
  • 特定のテーマについての洞察を得るためにアーカイブを深く検索し、企業、人物、または技術に関する特集記事を作成します。たとえば、報道機関によって実施されることがあります。
  • 抽出された分析情報の価値を高めて、収益化につなげる。 たとえば、広告収益に依存するニュースやソーシャル メディアなどの業界では、抽出された分析情報を他のシグナルとして広告サーバーに使用することで、関連する広告を配信できます。

Web ポータルで分析情報 JSON を表示する

ビデオをアップロードしてインデックスを作成したら、Web ポータルから JSON 形式で分析情報をダウンロードします。

  1. Library タブを選択します。
  2. 目的のメディアを選択します。
  3. [ ダウンロード] を選択し、[ Insights (JSON)] を選択します。 JSON ファイルが新しいブラウザー タブで開きます。
  4. 応答例で説明されているキー ペアを見つけます。

API の使用

  1. ビデオ インデックスの取得要求を使用します。 &includeSummarizedInsights=falseを渡す。
  2. 次の応答例で説明されているキー ペアを見つけます。

応答の例

    "topics": [
      {
        "id": 1,
        "name": "Pens",
        "referenceId": "Category:Pens",
        "referenceUrl": "https://en.wikipedia.org/wiki/Category:Pens",
        "referenceType": "Wikipedia",
        "confidence": 0.6833,
        "iabName": null,
        "language": "en-US",
        "instances": [
          {
            "adjustedStart": "0:00:30",
            "adjustedEnd": "0:01:17.5",
            "start": "0:00:30",
            "end": "0:01:17.5"
          }
        ]
      },
      {
        "id": 2,
        "name": "Musical groups",
        "referenceId": "Category:Musical_groups",
        "referenceUrl": "https://en.wikipedia.org/wiki/Category:Musical_groups",
        "referenceType": "Wikipedia",
        "confidence": 0.6812,
        "iabName": null,
        "language": "en-US",
        "instances": [
          {
            "adjustedStart": "0:01:10",
            "adjustedEnd": "0:01:17.5",
            "start": "0:01:10",
            "end": "0:01:17.5"
          }
        ]
      },

重要

すべてのVI機能の 透明度に関する注意事項の概要 をお読みください。 各分析情報には、独自の透明性に関するメモもあります。

トピック推論に関する注意事項

  • ファイルをアップロードするときは、常に高品質のビデオ コンテンツを使用します。 推奨される最大フレーム サイズは HD で、フレーム レートは 30 FPS です。 1 つのフレームに含まれる人物は 10 人以下にする必要があります。 ビデオから AI モデルにフレームを出力する場合は、1 秒あたり約 2 つまたは 3 つのフレームのみを送信します。 10 個以上のフレームを処理すると、AI の結果が遅れる可能性があります。
  • ファイルをアップロードするときは、常に高品質の音声およびビデオ コンテンツを使用します。 分析を実行するには、1 分以上の自然な会話音声が必要です。 オーディオ効果は、非音声セグメントでのみ検出されます。 非音声区間の最小持続時間は2秒です。 音声コマンドや歌はサポートされていません。
  • 通常、200 ピクセル未満の小さなユーザーまたはオブジェクトと、座っているユーザーは検出されない場合があります。 同じような服や制服を着ている人は、同じ人物として検出され、同じID番号が与えられる可能性があります。 妨害されたユーザーまたはオブジェクトが検出されない可能性があります。 前向きと後ろ向きでポーズを取る人のトラックは、異なるインスタンスに分割される場合があります。

トピック推論コンポーネント

コンポーネント 定義
ソース言語 ユーザーは、インデックス作成のためにソース ファイルをアップロードします。
前処理中 文字起こし、OCR、顔認識 API は、メディア ファイルから分析情報を抽出します。
分析情報の処理 トピック AI は、前処理中に抽出された文字起こし、OCR、顔認識の分析情報を分析します。
- 書き起こされたテキスト、書き起こされたテキストの行ごとの分析情報が、オントロジベースの AI テクノロジを使用して調べられます。
- OCR と顔認識の分析情報は、オントロジベースの AI テクノロジを使用して一緒に調べられます。
後処理 - 書き起こされたテキスト、分析情報が抽出され、書き起こされたテキストの行番号と共にトピック カテゴリに関連付けられます。 例: 政治、7 行目。
- OCR と顔認識、各分析情報が、メディア ファイル内のトピックのインスタンスの時刻と共にトピック カテゴリに関連付けられます。 例: Freddie Mercury、人物および音楽カテゴリ、20.00。
信頼度値 各トピックの推定信頼度レベルは、0 から 1 の範囲として計算されます。 信頼度スコアは、結果の精度の確実性を表しています。 たとえば、82% の確実性はスコア 0.82 として表されます。

サンプル コード

VIのすべてのサンプルを見る