次の方法で共有


Azure AI Content Understanding の用語

用語 説明
ファイル テキスト、ドキュメント、画像、ビデオ、オーディオなど、あらゆる種類のデータ。
ファイルの種類 テキスト/プレーン、アプリケーション/pdf、画像/jpeg、オーディオ/wav、ビデオ/mp4 などのファイルの MIME の種類。 "ドキュメント" などの一般的なカテゴリは、サービスでサポートされているすべての対応する MIME の種類を意味します。
アナライザ ファイルのコンテンツと構造化フィールドを処理して抽出するコンポーネント。 コンテンツの解釈には、一般的なシナリオ用のアナライザー テンプレートがいくつか用意されています。
アナライザー テンプレート アナライザーの定義済みの構成とフィールド スキーマ。 アナライザーを最初から作成するのでなく、テンプレートに変更を加えて作成し、アナライザーの作成を簡略にできます。 この機能は、REST API/SDK 経由ではなく、 Azure AI Foundry ポータルでのみ使用できます。
アナライザーの結果 入力データの処理後にアナライザーによって生成される出力。 通常、Markdown で抽出されたコンテンツ、抽出されたフィールド、オプションのモダリティ固有の詳細が含まれます。
アドオン ドキュメント内のレイアウト要素、バーコード、図形など、コンテンツ抽出の結果を強化する機能を追加しました。
フィールド フィールド スキーマによって定義された、コンテンツから派生した構造化キーと値のペアの一覧。 サポートされているフィールド値型の詳細をご確認ください。
フィールド スキーマ 入力から抽出するフィールドの正式な説明。 各フィールドの名前、説明、値の型、生成メソッドなどを指定します。
生成方法 指定したフィールドの抽出された値を決定するプロセス。 コンテンツの解釈では、次の機能がサポートされます。
抽出: 領収書の日付や請求書の明細など、入力コンテンツから値を直接抽出します。
分類: 通話のセンチメントやグラフの種類など、定義済みのカテゴリにコンテンツを分類します。
生成: 音声会話の要約やビデオからのシーンの説明の生成など、入力データから値を生成します。
スパン 抽出された Markdown コンテンツ内の要素 (フィールド、単語など) の位置を示す参照。 文字オフセットと長さは、範囲を表します。 さまざまなプログラミング言語で、さまざまな文字エンコードが使用されます。この違いのために、Unicode テキストの正確なオフセット値と長さの値が影響を受ける可能性があります。 範囲は、混乱を避けるために、要求内に目的のエンコードが明示的に指定されている場合にのみ返されます。 一部の要素は、Markdown (ページなど) で連続していない場合に、複数の範囲にマップできます。
処理場所 Azure AI Services がデータを分析する地理的リージョンを定義する API 要求パラメーター。 geographydataZoneglobalの 3 つのオプションから選択して、処理の発生場所を制御できます。 この設定は、データ所在地の要件を満たし、ニーズに基づいてパフォーマンスやスケーラビリティを最適化するのに役立ちます。
グラウンディング ソース 値が生成されたコンテンツ内の特定の領域。 ファイルの種類によって、表現が異なります。
画像 - 画像内の多角形であり、多くの場合、軸に平行な四角形 (境界ボックス)。
PDF/TIFF - 特定のページ上の多角形 (多くの場合、四角形)。
オーディオ - 開始時刻と終了時刻の範囲。
ビデオ - 開始時刻と終了時刻の範囲であり、各フレームにオプションの多角形 (多くの場合、境界ボックス) が含まれます。
人名簿 認識タスク用の顔データを格納するための構造化された方法。 ディレクトリに個々の顔を追加し、後で視覚的に似た顔を検索できます。 また、人物プロファイルを作成し、顔を関連付け、新しい顔画像を既知の個人に照合することもできます。 このセットアップでは、柔軟な顔照合と画像とビデオ全体の ID 認識の両方がサポートされます。
信頼度スコア 抽出されたデータが正確であることの確実性のレベル。
カテゴリ 共有の特性または特徴に基づいて類似の入力ファイルをグループ化するために使用される分類子内の個別のクラス。