非構造化コンテンツから情報を抽出してマップする
ソリューションのアイデア
この記事ではソリューションのアイデアについて説明します。 クラウド アーキテクトはこのガイダンスを使用すると、このアーキテクチャの一般的な実装の主要コンポーネントを視覚化しやすくなります。 ワークロードの特定の要件に適合する、適切に設計されたソリューションを設計するための出発点として、この記事を使用してください。
このアーキテクチャでは、信頼度スコアリングとユーザー検証を使用してデータを抽出し、マルチモーダル コンテンツ全体にスキーマを適用するコンテンツ処理ソリューションについて説明します。 非構造化コンテンツから情報を抽出し、構造化された形式にマッピングすることで、要求、請求書、契約、およびその他のドキュメントを処理します。 このアーキテクチャは、Azure AI Foundry、Azure AI Content Understanding、Azure AI Foundry Models の Azure OpenAI、およびその他の Azure サービスを適用して、イベントドリブン処理パイプラインを介して大量の非構造化コンテンツを変換します。
このアーキテクチャでは、コンテンツを処理するためのスケーラブルなシステムを構築する方法を示します。 システムは、テキスト、画像、テーブル、グラフを処理し、ビジネス ドキュメント ワークフローの自動品質チェックと人間によるレビューを含みます。
アーキテクチャ
このアーキテクチャの Visio ファイルをダウンロードします。
Workflow
次のワークフローは、上記のダイアグラムに対応しています。
ユーザーは、Web フロントエンド インターフェイスを使用して、ドキュメント、画像、コントラクト、請求書などのマルチモーダル コンテンツをアップロードします。 コンテンツは、特定の処理要件とターゲット スキーマで送信されます。
Azure Container Apps Web サイトは、コンテンツアップロード要求を受け取り、Container Apps でホストされている処理 API を呼び出します。 どちらのコンポーネントも、このシナリオに合わせてカスタマイズされたカスタム コードソリューションです。 API は適切な処理パイプラインを選択し、コンテンツ分析ワークフローを開始します。
Container Apps は、処理ワークフローを管理します。 これは、光学式文字認識 (OCR) を実行し、テキストを抽出する Content Understanding と Foundry Models の Azure OpenAI を接続します。 これらのモデルはスキーマをマップし、抽出されたデータを構造化された形式に変換します。
Content Understanding は、機械学習ベースの OCR を実行して、画像、テーブル、グラフなど、さまざまなコンテンツ形式から効率的にテキストを抽出します。
GPT Vision を使用した Foundry Models の Azure OpenAI は、抽出されたコンテンツを処理し、それをカスタムまたは業界で定義されたスキーマにマップし、信頼度スコアリングを使用して構造化された JSON 出力を生成します。
Container Apps のオーケストレーション コードは、Azure Cosmos DB の監査証跡と継続的な改善のために、処理された結果、信頼度スコア、スキーマ マッピング、履歴処理データを格納します。
Container Apps のオーケストレーション コードでは、Azure Blob Storage を使用して、信頼性の高いデータの永続化と取得のために、ソース ドキュメント、中間処理成果物、および最終的な構造化出力を格納します。
Azure Queue Storage は、このソリューションのサービス間のイベント ドリブン処理ワークフローを管理します。 この管理により、パイプライン コンポーネント全体の信頼性の高いメッセージ処理と処理の調整が保証されます。
コンテンツ プロセッサ モニター Web サイトには、Web インターフェイスを介して処理された結果がユーザーに表示されます。 ユーザーは、構造化された JSON 出力を確認し、不正確な情報を修正し、コンテキストまたはフィードバックのコメントを追加して、検証された最終的な結果をシステムに保存できます。
コンテンツ プロセッサ モニター Web サイトは、処理メトリックとユーザー フィードバック データを Power BI ダッシュボードに直接フィードします。 Azure Cosmos DB に格納されている処理されたデータとメタデータは、コンテンツ処理パイプラインに関する包括的な分析を提供します。 これらの分析情報には、KPI、成功率、ドキュメントの種類の分布、信頼度スコアの傾向、ユーザー修正パターン、およびコンテンツ処理パイプラインのデータドリブン最適化をサポートするその他の運用メトリックが含まれます。
コンポーネント
Container Apps は、サーバーレス プラットフォームでマイクロサービスとコンテナー化されたアプリケーションを実行するために使用できるサーバーレス コンテナー プラットフォームです。 このアーキテクチャでは、Container Apps は、コンテンツ分析を調整し、AI サービス間で調整し、抽出ワークフローと変換ワークフローを管理する処理パイプライン API をホストします。 実行されるコードは、ソフトウェア エンジニアリング チームによってカスタム コーディングされています。
Azure AI Foundry は、自然言語の処理と生成のための高度な言語モデルへのアクセスを提供するマネージド AI サービスです。 このアーキテクチャでは、Azure AI Foundry は、コンテンツ処理パイプラインで使用される AI モデルをデプロイおよび管理するための基盤を提供し、Content Understanding などの接続された AI サービスへのゲートウェイです。
Foundry Models の Azure OpenAI は、GPT-4o や GPT-4o mini などの言語モデルを提供する Azure AI Foundry のコンポーネントです。 このアーキテクチャでは、モデルは Azure AI Foundry でサービスとしてホストされます。 これらのモデルは、スキーマベースのデータ変換を実行し、抽出されたコンテンツを構造化された形式にマップし、抽出精度の信頼度スコアを計算します。
Content Understanding は、オーディオ、ビデオ、テキスト、画像などのさまざまなメディア コンテンツを分析し、構造化された検索可能なデータに変換するマルチモーダル AI サービスです。 このアーキテクチャでは、Content Understanding は、マルチモーダル ドキュメントからの高度な OCR とコンテンツ抽出を正確に実行します。
Azure Cosmos DB は、低待機時間と柔軟なスケーラビリティを保証する、グローバルに分散された複数モデルのデータベース サービスです。 このアーキテクチャでは、Azure Cosmos DB は、監査証跡とパフォーマンスの最適化のために、処理された結果、信頼度スコア、検証結果、履歴処理データを格納します。
Blob Storage は、大量の非構造化データを格納するために最適化された Microsoft のオブジェクト ストレージ ソリューションです。 このアーキテクチャでは、Blob Storage は、信頼性の高い持続性とグローバルなアクセシビリティを備えたソース ドキュメント、中間処理成果物、および最終的な構造化された出力を維持します。
Azure Container Registry は、コンテナー イメージを格納および管理するマネージド Docker レジストリ サービスです。 このアーキテクチャでは、Container Registry は処理パイプライン コンポーネントのバージョン管理されたコンテナー イメージを管理します。 このシステムにより、一貫性のあるデプロイとロールバックの機能が保証されます。
Power BI は、ソフトウェア サービス、アプリ、コネクタのコレクションであり、お客様と組織に最適な方法でビジネス分析情報を作成、共有、使用するのに役立ちます。 このアーキテクチャでは、Power BI は Azure Cosmos DB に接続し、監視 Web アプリケーションからリアルタイム処理メトリックを受け取り、ドキュメント処理のパフォーマンス、ユーザー フィードバック パターン、運用 KPI に関する包括的な分析を提供します。
シナリオの詳細
このコンテンツ処理ソリューションは、組織が毎日受信する大量の非構造化マルチモーダル コンテンツから意味のあるデータを抽出するという課題に対処します。 契約、請求書、クレーム、コンプライアンス レポートなどのドキュメントの従来の手動処理は、時間がかかり、エラーが発生しやすく、ビジネスの成長に合わせてスケーリングされません。 その結果、組織は一貫性のないデータ品質、標準化の欠如、抽出された情報をダウンストリームのビジネス プロセスに統合することが困難になります。
このソリューションでは、高度な AI サービスを使用して、さまざまな種類のドキュメントからコンテンツを自動的に抽出、変換、検証します。 システムは信頼度スコアリングを提供し、信頼度の高い抽出の自動処理を可能にしながら、人間のレビューのために信頼度の低い結果にフラグを設定します。 このアプローチにより、速度と精度の両方が確保され、多様なコンテンツ形式とカスタム ビジネス スキーマを処理する柔軟性が維持されます。
考えられるユース ケース
金融サービスの処理
要求処理の自動化: 自動検証とコンプライアンスチェックを使用して、保険金請求のドキュメント、写真、調整者レポートからポリシーの詳細、損害評価、コスト見積もりを抽出します。
請求書と契約の処理: 請求書と契約からベンダー情報、品目、条件、条件を自動的に抽出し、承認ワークフローの信頼度スコアリングを使用してエンタープライズ システムにマップします。
規制ドキュメント分析: 規制のファイリング、コンプライアンス レポート、監査ドキュメントを処理して、主要なメトリックを抽出し、財務規制とレポート要件への準拠を確保します。
医療に関するドキュメント
臨床文書処理: 医療記録、ラボレポート、臨床ノートから患者情報、診断、治療計画、および医薬品情報を抽出し、電子健康記録統合を行います。
医療請求の自動化: 医療請求、請求明細書、保険フォームを処理して、自動請求ワークフローのプロシージャ コード、患者の詳細、カバレッジ情報を抽出します。
調査データの抽出: 臨床試験のドキュメント、研究論文、および患者の同意フォームを分析して、医療研究ワークフローの研究パラメーター、結果、コンプライアンス データを抽出します。
法的およびコンプライアンス
コントラクトの分析と抽出: 法的契約、契約、および修正を処理して、契約管理とコンプライアンスの監視のための主要な条件、義務、日付、および関係者を抽出します。
法的ドキュメントの検出: 訴訟のサポートとケースの準備に関する関連する事実、引用、証拠を抽出するために、法的な概要、堆積物、およびケース ファイルを分析します。
コンプライアンスに関するドキュメント: 規制の提出、監査レポート、コンプライアンス証明書を処理して、ガバナンス ワークフローの要件、結果、是正措置を抽出します。
製造とサプライ チェーン
品質ドキュメントの処理: 品質管理ドキュメントと証明書から検査結果、テスト データ、および認定の詳細を抽出し、コンプライアンスの追跡とプロセスの改善を行います。
サプライヤーのドキュメント: 調達ワークフローのコンプライアンス データとサプライ チェーン情報を抽出するために、ベンダーの認定、材料仕様、出荷ドキュメントを処理します。
メンテナンス レコード分析: 予測メンテナンスおよび資産管理システムの技術ドキュメントから、機器データ、メンテナンス スケジュール、修理履歴を抽出します。
選択肢
このアーキテクチャには、ワークロードの機能要件と非機能要件に応じて、他の Azure サービスまたはアプローチに置き換えることができる複数のコンポーネントが含まれています。 次の代替手段とトレードオフを検討してください。
コンテンツ抽出アプローチ
現在のアプローチ: このソリューションでは、Content Understanding を使用して、高度な OCR とコンテンツ抽出を Azure OpenAI と組み合わせてスキーマ マッピングと変換を行います。 この方法では、柔軟なスキーマのカスタマイズにより、複雑なマルチモーダル コンテンツの精度が高くなります。
別の方法: 請求書、領収書、フォームなどの一般的なドキュメントの種類に対して事前構築済みのモデルを使用して、ドキュメント処理に Azure AI ドキュメント インテリジェンスを使用します。 この方法では、標準のドキュメントの種類に対する実装が高速化されますが、カスタム スキーマの柔軟性は低くなります。
ワークロードに次の特性がある場合は、この代替手段を検討してください。
主に、適切に定義された書式を持つ標準のドキュメントの種類を処理します。
事前構築済みの抽出モデルを使用して、市場投入までの時間を短縮する必要があります。
スキーマ要件は、標準のドキュメント インテリジェンス モデルと一致します。
スキーマ マッピング用のカスタム開発リソースが制限されています。
オーケストレーションの処理
現在のアプローチ: このソリューションでは、Container Apps を使用して、コンテンツ分析パイプラインを調整するカスタム処理ロジックをホストします。 この方法では、処理ワークフロー、エラー処理、およびカスタム ビジネス ロジック統合を最大限に制御できます。
別の方法: AI サービスへの組み込みコネクタを使用したワークフロー オーケストレーションには、Azure Logic Apps または Azure Functions を使用します。 このアプローチでは、視覚的なワークフロー設計とマネージド サービスの利点が得られますが、処理ロジックの制御は少なくなります。
ワークロードに次の特性がある場合は、この代替手段を検討してください。
カスタム コード開発よりも視覚的なワークフロー設計を優先します。
処理ワークフローは比較的単純であり、標準の条件付きロジックを使用します。
インフラストラクチャ管理のオーバーヘッドを最小限に抑える必要があります。
チームは、コンテナー化されたアプリケーションよりも低コードおよびコードなしのソリューションに関する専門知識を持っています。
コストの最適化
コストの最適化では、不要な経費を削減し、運用効率を向上させる方法に重点を置いています。 詳細については、「コスト最適化の設計レビュー チェックリスト」を参照してください。
このシナリオを実行するためのコストの詳細については、 Azure 料金計算ツールで構成済みの見積もりを参照してください。
価格はリージョンと使用状況によって異なるため、デプロイの正確なコストを予測することはできません。 このインフラストラクチャで使用されるほとんどの Azure リソースは、使用量ベースの価格レベルに従います。 ただし、Container Registry では、1 日あたりのレジストリあたりの固定コストが発生します。
このシナリオのデプロイ
このアーキテクチャの実装をデプロイするには、 GitHub リポジトリの手順に従います。
貢献者達
Microsoft では、この記事を保持しています。 次の共同作成者がこの記事を書きました。
主要著者:
- ソロモン・ピケット |ソフトウェア エンジニア II
その他の共同作成者:
- トッドハーマン |プリンシパル ソフトウェア エンジニア
公開されていない LinkedIn プロフィールを見るには、LinkedIn にサインインしてください。