Azure AI Content Understanding は、ドキュメント、画像、ビデオ、オーディオなどのマルチモーダル コンテンツから構造化された分析情報を導き出すように設計された高度な生成 AI サービスです。 2025-05-01-preview
バージョンの導入により、サービスには、standard
とpro
の 2 つの異なるモードが提供されるようになりました。
標準: このモードは、多様なコンテンツ タイプを処理するための既定のソリューションとして機能します。 すべてのデータ形式の特定のタスクに合わせて調整された効率的なスキーマ抽出を提供するように最適化されています。 このモードは、コスト効率と待機時間の短縮を重視し、一般的な処理ニーズに合わせて構造化された分析情報にアクセスできるようにします。
Pro: このモードは、高度なユース ケース、特にマルチステップ推論と複雑な意思決定 (不整合の特定、推論の描画、高度な意思決定など) を必要とするユース ケース向けに設計されています。 Pro モードでは、複数のコンテンツ ファイルからの入力が可能で、アナライザーの作成時に参照データを提供するオプションが含まれています。 現在、Pro モードはドキュメント ベースのデータに対してのみ提供されています。
標準モードの概要
Content Understanding 標準モードでは、ドキュメント、ビデオ、画像、オーディオ、テキストなど、さまざまなデータ型にわたって構造化された分析情報が提供されます。 データ推論はサポートされていませんが、コストと待機時間を最小限に抑え、広範なデータ中心のシナリオに最適です。 このモードでは、スキーマを作成またはカスタマイズして、ニーズに合わせて調整された正確な分析情報を抽出できます。 さらに、ドキュメント データのデータ ラベル付けが組み込まれており、人間の入力によって出力の品質が向上します。
標準モード: ユース ケース
Standard は、あらゆる種類のデータに対して必要な正確な分析情報を抽出するための理想的なサービスです。 データのコンテンツのロックを解除するだけの場合は、シナリオで複雑な推論や意思決定を必要としない可能性があります。 標準モードが適切に動作するシナリオは次のとおりです。
- RAG 検索ワークフローを活用し、 AI Search と統合するためにデータを構造化します。
- Microsoft Fabric と統合するためのデータの抽出。
- 広告ビデオを分析してコンテンツ ガイドラインを表示する。
- ビデオ映像をセグメント化して章を作成し、理想的な広告の中断を特定します。
- スポーツ ゲームから重要なデータ ポイントを抽出し、ゲーム後の要約を提供する。
Pro モードの概要
Content Understanding Pro モードは、複雑なユース ケースを持つお客様向けに調整され、複数ステップの推論機能と複数入力ドキュメントのサポートを提供します。 入力コンテンツと参照データの両方を推論できるため、複雑な分析が必要なシナリオに最適です。 参照データを組み込むことで、pro モードは各要求にコンテキストを追加し、検証やエンリッチメントなどのタスクを支援します。 現在、Pro モードはドキュメント データでのみ使用できます。
Pro モードの参照データ
アナライザーの作成時に、推論時にサービスを参照するコンテキストの提供に役立つドキュメントを提供できます。 たとえば、請求書を分析して契約契約と一致していることを確認する場合は、請求書とその他の関連ドキュメント (発注書など) を入力として指定し、契約ファイルを参照データとして指定できます。 このサービスでは、スキーマに従って入力ドキュメントを検証するための推論が適用されます。これは、さらに確認するためにフラグを設定する不一致を特定する場合があります。 ドキュメントが Pro モードの入力ドキュメント サービスの制限内にある場合は、品質の問題が発生した場合は、すべてのドキュメントを入力ドキュメントとして指定することもお勧めします。
複数ステップの推論
複数ステップの推論により、複雑な問題を単純なタスクに分解できます。 複数ステップの推論では、構造化データを抽出して集計するよりもデータ分析をさらに進め、そのデータに関する結論を導き出し、人間によるレビューの必要性を最小限に抑えることができます。 プロ モードが複数ステップの推論で回答できる質問の種類の例を次に示します。
- x は y と一致しますか?
- x はアウトライン化された条件を満たしていますか?
- x ドキュメントは必要なガイドラインに従っていますか?
- 合計は項目の合計と等しいか。
- 請求書と契約の間のすべての不整合を見つけます。
標準モードとプロモードの機能
シナリオに適したモードがわからない場合 次のグラフは、標準モードとプロ モードの機能を比較します。
特徴 | 標準モード | Pro モード |
---|---|---|
大きなドキュメント | ✓ | ✓ |
フィールド モード | ✓ | ✓ |
フィールドの抽出、分類、生成 | ✓ | ✓ |
根拠と信頼度スコア | ✓ | |
入力ドキュメントの種類 | ドキュメント、画像、ビデオ、オーディオ | ドキュメント |
最大フィールド数 | 100 | 100 |
複数の入力ドキュメント処理 | ✓ | |
参照データセットの統合 | ✓ | |
複数ステップの推論 | ✓ |
シナリオに標準モードまたはプロ モードを適用する
Content Understanding の標準モードと Pro モードの両方をあらゆるシナリオに適用できますが、ソリューションを構築する方法は、回答を目指す質問によって異なります。 次のシナリオでは、データに標準モードとプロ モードを適用する方法の例を示します。
シナリオ | 標準モード | Pro モード |
---|---|---|
請求書分析 | 請求書データに関する分析情報を大規模に抽出し、RAG 検索とさらなるデータ分析と視覚化を可能にします。 次のような質問に回答します。 • データベースに入力するための発注書番号、合計、期限、および品目を抽出します。 |
顧客との請求書と契約契約を分析し、複数ステップの推論を適用して、そのデータに関する結論を導き出します。 次のような質問に回答します。 • この請求書は、このクライアントとの契約契約を満たしていますか? •この請求書は、さらなるレビューが必要ですか? |
コール センターのトランスクリプト分析 | 大量のコール センター データに関する分析情報を抽出して、センチメントに関する貴重な洞察を得て、顧客の問題を理解し、主要な問題点に対処するための対象トレーニングを作成します。 次のような質問に回答します。 •顧客が呼び出している主な問題は何ですか? • x 問題に関して行われた通話の平均長は何ですか。 |
コール センターのトランスクリプト データを分析し、複数ステップの推論を適用して、コール センターの従業員が顧客のニーズにどのように対処しているかを理解し、ガイドラインに従っているかどうかを理解します。 次のような質問に回答します。 • コールセンターの従業員は自己紹介をしましたか? • この回答は特定の基準を 満た しましたか? |
住宅ローン申請の処理 | 住宅ローンアプリケーションデータからキー値を抽出し、検索可能で簡単にアクセスできるようにします。 次のような質問に回答します。 • 住宅ローン申請は何年に提出されましたか? • アプリケーションの名前は何ですか? |
補足的なサポート ドキュメントと住宅ローンアプリケーションを分析して、住宅ローンを確保するために必要なすべてのドキュメントを住宅購入者が提供するかどうかを判断します。 次のような質問に回答します。 •住宅ローン申請の名前と社会保障番号は、サポートドキュメントと一致しますか? |
Pro モードを試す
Azure AI Foundry を使用して、Content Understanding の標準モードと Pro モードの両方の機能を試すことができます。 このサービスを使用すると、独自のデータを取り込み、両方のモードのすべての機能を軽量でコードなしのアプローチで試し、独自のシナリオに最適な方法を見つけることができます。
Pro モードの既知の制限事項とベスト プラクティス
コンテンツ理解プロモードでは、現在、信頼度スコアや根拠の提示はまだ提供されていません。 現在、フィールドの生成と分類はサポートされていますが、抽出のみをサポートしていません。
Content Understanding Pro モードは現在、ドキュメントでのみ使用できます。
システムは、ドキュメントを 参照するときに参照モード で動作します。 その結果、包括的な情報の取得は期待できません。 データを完全に復旧する必要がある場合は、ドキュメントを入力セットに組み込むことをお勧めします。
スキーマは、可能な限り高いレベルの特定性で設計する必要があります。 たとえば、不整合の一般化されたリストを提示する代わりに、不整合の種類ごとに個別のフィールドを作成し、詳細な説明と共に作成することをお勧めします。 さらに、可能な限り、レビューする必要がある関連ドキュメントの特定のセクションへの参照を含める必要があります。
参照ドキュメントは簡潔にし、重点を置く必要があります。 重要なドキュメントに優先順位を付け、保持とリコールを強化するためにできるだけ簡潔にしてください。
次のステップ
伝票処理の詳細については、 伝票処理の概要を参照してください。