次の方法で共有


ドキュメント処理に Copilot Studio の自律エージェントを使用する

ドキュメント処理エージェントは Copilot Studio の自律エージェントで、生成 AI を使ってドキュメントを処理します。

チップ

マネージド エージェント Document Processor は、エンドツーエンドのドキュメント処理に向けたパッケージ ソリューションです。 抽出、検証、人間による監視、ダウンストリーム アプリへのエクスポートを処理します。 この記事では、ドキュメントを処理するために Copilot Studio で自律エージェントを使用するためのリファレン スアーキテクチャを示します。 アーキテクチャの例は、さまざまなシナリオや業界に適応させることができます。

アーキテクチャ ダイアグラム

ドキュメント処理に Copilot Studio の自律エージェントを使用する場合のワークフローを示す図。

エージェントの指示

次の手順では、自律型エージェントを作成します:

You are a helpful, polite, document processing agent. You help users process documents and extract valuable information. 
If the user asks about any topic other than document processing, politely decline and offer to help with document-related queries.
When asked to process a document with a specific document processing event ID, extract the information from that document.
When told that a document processing event status of a document changes to Processed, validate the extracted information from the document.
When told that a document processing event status of a document changes to Validated, import the extracted information from the document into the system.
When told that a document processing event status of a document changes to Manual Review, submit the extracted information from the document to manual review.
Ignore other document processing event status changes.

ワークフロー

エージェントに関連する 2 つの重要なワークフローがあります。

  • ドキュメント処理: このワークフローは、エージェントがドキュメントを処理する方法を説明します。
  • 構成: このワークフローでは、自律的なドキュメント処理のためにエージェントをセットアップする手順を詳しく説明します。

ドキュメント処理フロー

ドキュメント処理フローは状態を表わすマシンのように動作します。 エージェントはオーケストレータとして動作し、現在の状態は Dataverse のデータ処理イベント テーブルに保存されます。 そのプロセスは以下の通りです:

  1. トリガーは、新しいドキュメントの処理準備が整ったことを識別します。 これは、アーキテクチャー ダイアグラムのデータ ソース エリアに示されています。 エージェント フローは、Outlook のメールボックスや SharePoint フォルダなどのディレクトリをスキャンします。 ドキュメントがディレクトリに追加されると、エージェント フローはドキュメントをデータ処理イベントテーブルにステータス 「新規」として格納し、エージェントにメッセージ Process the document: {ID}. を送信します。

    • データ処理イベント テーブルのドキュメントの追加やステータスの更新は、すべて Power Automate の Default 構成に従います。 フローは、ステータス 408、429、または 5xx を返す要求、および接続例外に対して、指数関数的な間隔で最大 4 回再試行します。
    • 再試行がすべて失敗した場合は、デバッグを行い、実行されなかったアクションの Power Automate の実行履歴を確認します。
  2. エージェントの指示は、ドキュメントを処理するように要求された際に Document Extraction アクションを呼び出すように指示します。 アクションが実行され、メッセージ ID が渡されます。

  3. Document Extraction アクションは、データ処理イベント ID を入力として受け取るエージェント フローです:

    • Dataverse に格納されているドキュメントを取得します。
    • 処理するために AI Builder の AI プロンプトに送信します。 このプロンプトでは GPT 4.o を使用します:
      • ドキュメントからすべての関連情報を抽出します。
      • この情報を JSON ドキュメントとして書式設定します。
    • 抽出された情報を同じデータ処理イベント行に格納します。
    • ドキュメントのステータスを Processed に更新します。
  4. Dataverse トリガー (エージェント フロー) は、データ処理イベントのすべてのドキュメントのステータスを監視し、ステータスが変更されると、The status of document {ID} changed to {Status} というメッセージでエージェントに通知します

  5. エージェントの指示は、ドキュメントのステータスがDocument Validationに変化した際に アクションを呼び出すように指示します。 アクションが実行され、メッセージ ID が渡されます。

  6. Document Validation アクションは、データ処理イベント ID を入力として受け取るエージェント フローです:

    • Dataverse に格納されている抽出データを取得します。
    • 検証のため、AI Builder の AI プロンプトに送信します。 このプロンプトでは GPT 4.o を使用します:
      • 抽出された JSON を dates must be in X format のような形式ルールと照合します。
      • 抽出された JSON を the author of the document must be in the Accounts table in Dataverse のようなビジネス ルールと照合します。
    • 検証が成功すると、ドキュメントのステータスが Validated に更新されます。
    • そうでない場合は、ドキュメントのステータスを Manual Review に更新します。
  7. ドキュメントのステータスが Validated に変わった場合、エージェントに Document Export のアクションを呼び出すように指示します。 アクションが実行され、メッセージ ID が渡されます。

  8. ドキュメントのエクスポートアクションは、データ処理イベントIDを入力として受け取り、次のことを行うエージェントフローです。

    • Dataverse に格納されている抽出データを取得します。
    • このデータをターゲット システムにエクスポートします (例: Dataverse の Invoices テーブル)。
  9. ドキュメントのステータスが Manual Review に変わった場合、エージェントに Manual Review のアクションを呼び出すように指示します。 アクションが実行され、メッセージ ID が渡されます。

  10. Manual Review アクションは、データ処理イベント ID を入力として受け取るエージェント フローです:

    • Dataverse に格納されている抽出データを取得します。
    • エージェント管理者の承認リクエストを作成し、ユーザーが抽出されたデータを編集して手動で検証できる検証ステーションアプリへのリンクを共有します。 この手動の検証では、ドキュメントのステータスを Validated に設定します。
  11. 手動でのレビュー後、ドキュメントのステータスが Validated の場合、ステップ 7 が実行されます。

ユーザーは、エージェントに処理させるドキュメントを Copilot Studio のチャットページまたはエージェントを公開したチャネルを使用して手動で提出することもできます。

これを行うと次のようになります:

  • ドキュメントが [データ処理イベント] テーブルにアップロードされます。
  • エージェントは、新しいドキュメントがインポートされたことを自身に通知します。
  • 抽出プロンプトが実行され、チャット ペインにエクスポートされる内容のプレビューが表示されます。
  • ドキュメントは、手順 2 から開始して、このフローの説明に従って処理されます。

構成ワークフロー

エージェントが自律的に動作するには、いくつかの構成が必要です。 これを簡単にするために、包括的な構成エクスペリエンスがあります。 ステップは次のようになります。

  1. Copilot Studio にドキュメント処理エージェントをインストールします。 エージェント ソリューションには次のものがあります。
    • ドキュメント処理構成テーブル。
    • 監視用の検証ステーションキャンバス アプリ。
    • エージェントが使用する接続参照 (Dataverse、Copilot Studio、PowerApps for Admins)。
    • エージェントのワークフロー (Outlook、SharePoint) を開始するトリガーで使用される接続参照。
    • トリガーが使用する環境変数。
  2. エージェント構成ウィザードを起動します。 これは Copilot Studio のインストールウィザードの最後のステップです。 このフローがガイドしてくれます:
    1. サンプル ドキュメントをアップロードします。
    2. アップロードされたドキュメントがエージェントの抽出プロンプトに送信されます。
    3. 抽出されたコンテンツとドキュメントタイプが表示されます。 抽出されたデータのどの部分をシステムにエクスポートするかを選択します。 これにより、ドキュメント処理構成テーブルに格納され、ドキュメントのエクスポート アクション中に使用されるスキーマが作成されます。 詳細モードに入ると、ドキュメント抽出アクションで使用される AI プロンプトを変更してカスタマイズできます。
    4. ドキュメント検証アクションで使用されるプロンプトにルールを追加するシンプルな UI を使用して、検証ルールを定義します。 詳細モードに入って、AI プロンプトを直接変更することもできます。
    5. プロンプトが表示されたら、エージェント管理者のメールアドレスを入力します。 これは、承認要求を作成する際の手動レビュー アクションで使用されます。 承認者へのカスタム メッセージを追加することもできます。 この情報は、ソリューションに付属する環境変数に保存されます。
    6. リストからドキュメントソースを選択します。 これらのトリガーはドキュメント処理フローを開始し、通常、選択したドキュメント ソースに応じて、接続参照といくつかの環境変数 (メールボックス名やフォルダー アドレスなど) を必要とします。
    7. 構成を完了します。 これにより、先に選択した列を持つ Dataverse テーブルがシステム内に作成され、ウィザードで使用したドキュメントがこのテーブルにエクスポートされます。

コンポーネント

以下は、Copilot Studio におけるドキュメント処理のための自律エージェントの構築と展開に関わる主要なコンポーネントです。

  • Copilot Studio は Microsoft Power Platform のノー コードまたはローコード ソリューションの一部です。 Copilot Studio は、エージェントを作成するグラフィカルなロー コード ツールで、エージェントフローによる自動化の構築や、企業データやシナリオを使用して Microsoft 365 Copilot を拡張することもできます。
  • Power Apps は Microsoft Power Platform のノー コードまたはローコード ソリューションの一部です。 Power Apps は、アプリ、サービス、コネクタ、データ プラットフォームのスイートであり、ビジネスのためのカスタムアプリを構築するための迅速な開発環境を提供します。 Power Apps を使用すると、基盤となるデータ プラットフォーム (Microsoft Dataverse) や、SharePoint、Microsoft 365、Dynamics 365、SQL Server などの多くのオンラインとオンプレミスのデータソース内のデータに接続するカスタム ビジネス アプリを迅速に構築できます。
  • Dataverse はマルチ エージェント シナリオ用の運用データベースです。 これにより、エージェントはステータスデータ、履歴、会話データを保存するための安全でスケーラブルなプラットフォームを利用できます。 この一元化されたストレージにより、エージェントは相互作用し、データを共有することができ、自律的または半自律的にタスクを実行できます。 Dataverse はまた、エージェントが CRM システムのような異なるビジネス アプリケーションのビジネス データに接続し、更新できるようになります。 Dataverse を使用することで、エージェントのワークフローを管理することで、信頼性、セキュリティ、優れた運用性を実現できます。

シナリオの詳細

組織は、フォーム、請求書、領収書、身分証明書などの構造化ドキュメントと、メモ、契約書、顧客フィードバック要求などの非構造化ドキュメントを扱います。 組織が直面する重要な課題の 1 つは、ドキュメント処理を自動化してビジネス プロセスを最適化することです。 ドキュメントの収集、分類、抽出、検証、変換、エクスポートなど、いくつかのステップを自動化できます。 ドキュメント処理エージェントを使用すると、従来のドキュメント処理に比べて多くの利点があります。 ドキュメント処理エージェントは、パッケージ化されたソリューションとしてそのまま使用できるため、セットアップ中に時間のかかるデータのラベル付けを行う必要はありません。 そのインタラクティブなデザインにより、人間の監視下で大量のドキュメントを処理できます。

考慮事項

これらの考慮事項は、ワークロードの品質を向上させる一連の基本原則である Power Platform Well-Architected の柱を実行します。 詳細については、Microsoft Power Platform Well-Architected を参照してください。

信頼性

ドキュメント処理エージェントは、Azure にホストされた Power Platform コンポーネントを使用することで、弾力性、回復性、運用性を高めるように設計されています。

セキュリティ

ドキュメント処理エージェントは、Azure でホストされた Power Platform コンポーネントを使用することで、機密性、完全性、データの可用性を保護するように設計されています。 データ処理イベントテーブルにインポートされたドキュメントは、システム管理者にのみ表示されます。 Dataverse には、添付ドキュメント以外のメール本文や件名などの追加データは保存されません。 ドキュメントに関連付けられているすべての顧客関連情報は、[データ処理イベント] テーブルの [処理済みデータ] 列に保存されます。 この列をクエリすることで、GDPR 要求を処理できます。

オペレーショナル エクセレンス

ドキュメント処理エージェントは、Azure にホストされた Power Platform コンポーネントを使用することで、監視と分析情報、自動化による効率化を実現し、オペレーションを改善できるように設計されています。

パフォーマンス効率

ドキュメント処理エージェントは、Azure にホストされた Power Platform コンポーネントを使用することで、最適化によるパフォーマンスを実現するように設計されています。 ドキュメント処理エージェントは、最大 20 MB サイズのドキュメントの処理をサポートします。 最新のベンチマークでは、2 MB サイズの 1 つのドキュメントを処理するのに約 48 秒かかります。 エージェントは、選択されたドキュメント ソースに十分なストレージがあれば、1,000 以上のドキュメントに対してこの処理時間を維持できるように設計されています。 その他のクォータと制限については、制限 - Power Automateを参照してください。

エクスペリエンスの最適化

ドキュメント処理エージェントは、ドキュメント処理ユーザーのために、Power Platform コンポーネントを使用することでシンプルさと効率性を実現します。 エージェントは、ドキュメント ソースを追加するための構成可能なエクスペリエンスを提供し、ドキュメント ソースを追加するための拡張性を可能にします。

責任ある AI

ドキュメント処理エージェントは、生成 AI 機能に向けて設計された Copilot Studio を含む Power Platform のコンポーネントを使用することで、責任ある AI 標準を達成するように設計されています。 詳細情報については、Copilot Studio の責任ある AI についてよくあるご質問を参照してください。

投稿者

Microsoft がこの記事を管理しています。 この記事を書いたのは、以下の寄稿者です。

作者代表:

次の手順

  • 構成フローを拡張して、ユーザーがエクスポート エクスペリエンスをカスタマイズできるようにします。 たとえば、SAP や Salesforce などのシステムにエクスポートする Power Platform コネクタをあらかじめ構築しておき、ユーザーが SAP や Salesforce のテーブルエントリに合わせてスキーマをカスタマイズできるようにします。
  • 構成フローを強化し、ユーザーが Outlook や SharePoint などの複数のドキュメント ソースに同時に接続できるようにします。
  • エージェントは、ドキュメントタイプに基づいてエクスポートで使用されるスキーマを動的に変更することで、複数のドキュメントタイプを同時に処理できます。