Freigeben über


Einen autonomen Agent in Copilot Studio für die Dokumentenverarbeitung verwenden

Der Dokumentenverarbeitungs-Agent ist ein autonomer Agent in Copilot Studio, der generative KI zum Verarbeiten von Dokumenten verwendet.

Tipp

Der verwaltete Agent Dokumentenverarbeiter ist eine Paketlösung für die End-to-End-Dokumentenverarbeitung. Es übernimmt die Extraktion, Validierung, menschliche Überwachung und den Export in nachgelagerte Apps. Dieser Artikel zeigt die Referenzarchitektur für die Verwendung eines autonomen Agents in Copilot Studio zur Verarbeitung von Dokumenten. Sie können das Architekturbeispiel für verschiedene Szenarien und Branchen anpassen.

Architekturdiagramm

Diagramm, das den Workflow für die Verwendung eines autonomen Agents in Copilot Studio für die Dokumentenverarbeitung zeigt.

Agent-Anweisungen

Mit den folgenden Anweisungen wird der autonome Agent erstellt:

You are a helpful, polite, document processing agent. You help users process documents and extract valuable information. 
If the user asks about any topic other than document processing, politely decline and offer to help with document-related queries.
When asked to process a document with a specific document processing event ID, extract the information from that document.
When told that a document processing event status of a document changes to Processed, validate the extracted information from the document.
When told that a document processing event status of a document changes to Validated, import the extracted information from the document into the system.
When told that a document processing event status of a document changes to Manual Review, submit the extracted information from the document to manual review.
Ignore other document processing event status changes.

Workflows

Es gibt zwei wichtige Workflows im Zusammenhang mit dem Agenten:

  • Dokumentenverarbeitung: In diesem Workflow wird erläutert, wie der Agent Dokumente verarbeitet.
  • Konfiguration: Dieser Workflow beschreibt die Schritte zum Einrichten des Agents für die autonome Dokumentenverarbeitung.

Dokumentenverarbeitungsflow

Der Dokumentenverarbeitungsablauf funktioniert wie ein Zustandsautomat. Der Agent fungiert als Orchestrator. Der aktuelle Status wird in der Tabelle „Datenverarbeitungsereignisse“ in Dataverse gespeichert. So funktioniert der Prozess:

  1. Ein Trigger identifiziert, wann ein neues Dokument zur Verarbeitung bereit ist. Dies wird im Bereich Datenquellen im Architekturdiagramm angezeigt. Agent-Flows durchsuchen Verzeichnisse wie Outlook-Postfächer oder SharePoint-Ordner. Wenn ein Dokument irgendeinem Verzeichnis hinzugefügt wird, speichert der Agent-Flow es in der Tabelle „Datenverarbeitungsereignisse“ mit dem Status „Neu“ und sendet eine Nachricht an den Agent: Process the document: {ID}.

    • Alle Versuche, Dokumente hinzuzufügen oder den Status in der Tabelle „Datenverarbeitungsereignisse“ zu aktualisieren, folgen der Default-Konfiguration in Power Automate. Der Flow wird bis zu viermal mit einem exponentiellen Intervall für Anforderungen wiederholt, die den Status 408, 429 oder 5xx zurückgeben, sowie für alle Konnektivitätsausnahmen.
    • Wenn alle Wiederholversuche fehlschlagen, debuggen und überprüfen Sie den Ausführungsverlauf in Power Automate für die Aktion, die nicht ausgeführt werden konnte.
  2. Die Agent-Anweisungen weisen ihn an, die Document Extraction-Aktion aufzurufen, wenn er aufgefordert wird, ein Dokument zu verarbeiten. Die Aktion wird ausgeführt, und die Nachrichten-ID wird übergeben.

  3. Bei der Document Extraction-Aktion handelt es sich um einen Agent-Flow, der eine Datenverarbeitungsereignis-ID als Eingabe erhält und:

    • dafür sorgt, dass das Dokument in Dataverse gespeichert wird.
    • es an einen KI-Prompt in AI Builder zur Verarbeitung sendet. Dieser Prompt nutzt GPT 4.o für folgende Aufgaben:
      • Extrahieren aller relevanten Informationen aus dem Dokument
      • Formatieren dieser Informationen als JSON-Dokument
    • Speichert die extrahierten Informationen in derselben Datenverarbeitungsereigniszeile.
    • aktualisiert den Status des Dokuments auf Processed.
  4. Ein Dataverse-Trigger (Agent-Flow) überwacht den Status aller Dokumente in den Datenverarbeitungsereignissen und benachrichtigt den Agent, wenn sich ein Status ändert, mit der folgenden Nachricht: The status of document {ID} changed to {Status}

  5. Die Agent-Anweisungen weisen ihn an, die Document Validation-Aktion aufzurufen, wenn sich der Status des Dokuments in Verarbeitet ändert. Die Aktion wird ausgeführt, und die Nachrichten-ID wird übergeben.

  6. Bei der Aktion Document Validation handelt es sich um einen Agent-Flow, der eine Datenverarbeitungsereignis-ID als Eingabe erhält und:

    • die extrahierten Daten abruft, die in Dataverse gespeichert sind.
    • sie an einen KI-Prompt in AI Builder zur Validierung sendet. Dieser Prompt nutzt GPT 4.o für folgende Aufgaben:
      • Überprüfung des extrahierten JSONs anhand von Formatregeln wie dates must be in X format
      • Überprüfung des extrahierten JSONs anhand von Geschäftsregeln wie the author of the document must be in the Accounts table in Dataverse
    • Wenn die Validierung erfolgreich ist, wird der Status des Dokuments auf Validated aktualisiert.
    • Andernfalls wird der Status des Dokuments auf Manual Review aktualisiert.
  7. Wenn sich der Status des Dokuments in Validated ändert, ruft der Agent gemäß der Anweisungen die Document Export-Aktion auf. Die Aktion wird ausgeführt, und die Nachrichten-ID wird übergeben.

  8. Bei der Aktion „Dokumentexport“ handelt es sich um einen Agent-Fluss, der eine Datenverarbeitungsereignis-ID als Eingabe erhält und:

    • die extrahierten Daten abruft, die in Dataverse gespeichert sind.
    • diese Daten in das Zielsystem exportiert, z. B. in die Tabelle „Rechnungen“ in Dataverse.
  9. Wenn sich der Status des Dokuments in Manual Review ändert, ruft der Agent gemäß der Anweisungen die Manual Review-Aktion auf. Die Aktion wird ausgeführt, und die Nachrichten-ID wird übergeben.

  10. Bei der Manual Review-Aktion handelt es sich um einen Agent-Flow, der eine Datenverarbeitungsereignis-ID als Eingabe erhält und:

    • die extrahierten Daten abruft, die in Dataverse gespeichert sind.
    • eine Genehmigungsanforderung für die Fachkraft für die Agent-Administration erstellt und eine Verknüpfung zu einer Validierungsstation-App freigibt, wo der Benutzende extrahierte Daten bearbeiten und manuell prüfen kann. Diese manuelle Prüfung legt den Status des Dokuments auf Validated fest.
  11. Wenn der Status des Dokuments nach der manuellen Überprüfung Validated lautet, wird Schritt 7 ausgeführt.

Benutzende können Dokumente auch manuell über die Chatseite in Copilot Studio oder einen beliebigen Kanal, in dem sie den Agent veröffentlicht haben, zur Verarbeitung an den Agent übermitteln.

Beachten Sie in diesem Fall Folgendes:

  • Das Dokument wird in die Tabelle „Datenverarbeitungsereignisse“ hochgeladen.
  • Der Agent benachrichtigt sich selbst, dass ein neues Dokument importiert wurde.
  • Die Eingabeaufforderung zum Extrahieren wird ausgeführt, um Ihnen eine Vorschau dessen zu geben, was im Chatbereich exportiert wird.
  • Das Dokument wird wie in diesem Ablauf ab Schritt 2 beschrieben verarbeitet.

Konfigurationsworkflow

Der Agent benötigt mehrere Konfigurationen, um autonom zu arbeiten. Um dies zu vereinfachen, gibt es eine umfassende Konfigurationsoberfläche. Gehen Sie folgendermaßen vor:

  1. Installieren Sie den Dokumentenverarbeitungs-Agent in Copilot Studio. Die Agent-Lösung verfügt über Folgendes:
    • Eine Konfigurationstabelle für die Dokumentenverarbeitung
    • Eine Validierungsstation-Canvas-App für die Überwachung
    • Vom Agent verwendete Verbindungsreferenzen (Dataverse, Copilot Studio, PowerApps for Admins)
    • Von den Triggern, die den Agent-Workflow starten, verwendete Verbindungsreferenzen (Outlook, SharePoint)
    • Von den Triggern verwendete Umgebungsvariablen
  2. Starten Sie den Assistenten für die Agent-Konfiguration. Dies ist der letzte Schritt des Installationsassistenten in Copilot Studio. Er leitet Sie durch diesen Flow:
    1. Laden Sie ein Beispieldokument hoch.
    2. Das System sendet das hochgeladene Dokument an die Extraktionsaufforderung des Agenten.
    3. Der extrahierte Inhalt und der Dokumenttyp werden angezeigt. Wählen Sie aus, welche Teile der extrahierten Daten Sie in das System exportieren möchten. Dadurch wird ein Schema erstellt, das in der Konfigurationstabelle für die Dokumentverarbeitung gespeichert und während der Dokumentexportaktion verwendet wird. Sie können in den erweiterten Modus wechseln, um die in der Dokumentextraktionsaktion verwendete KI-Eingabeaufforderung zu ändern und anzupassen.
    4. Definieren Sie Validierungsregeln über eine einfache Benutzeroberfläche, die der in der Dokumentvalidierungsaktion verwendeten Eingabeaufforderung Regeln hinzufügt. Sie können auch in den erweiterten Modus wechseln, um die KI-Eingabeaufforderung direkt zu ändern.
    5. Geben Sie die E-Mail-Adresse des Agent-Administrators ein, wenn Sie dazu aufgefordert werden. Dies wird in der manuellen Überprüfungsaktion beim Erstellen der Genehmigungsanforderung verwendet. Sie können auch eine benutzerdefinierte Nachricht für die genehmigende Person hinzufügen. Diese Informationen werden in den Umgebungsvariablen gespeichert, die im Lieferumfang der Lösung enthalten sind.
    6. Wählen Sie eine Dokumentquelle aus einer Liste aus. Diese Trigger starten den Dokumentverarbeitungsfluss und benötigen in der Regel eine Verbindungsreferenz und einige Umgebungsvariablen (z. B. Postfachname oder Ordneradresse), je nach ausgewählter Dokumentquelle.
    7. Beenden Sie die Konfiguration. Dadurch wird im System eine Dataverse-Tabelle mit den zuvor ausgewählten Spalten angelegt und das Dokument, das Sie im Assistenten verwendet haben, wird in diese Tabelle exportiert.

Komponenten

Hier sind die wichtigsten Komponenten, die an der Erstellung und Bereitstellung eines autonomen Agents für die Dokumentenverarbeitung in Copilot Studio beteiligt sind.

  • Copilot Studio gehört zu den No-Code- oder Low-Code-Lösungen von Microsoft Power Platform. Copilot Studio ist ein grafisches Low-Code-Tool zum Erstellen eines Agents – dazu gehört auch das Erstellen von Automatisierung mit Agent-Flows – und zum Erweitern eines Microsoft 365 Copilot mit Ihren Unternehmensdaten und -szenarien.
  • Power Apps gehört zu den No-Code- oder Low-Code-Lösungen von Microsoft Power Platform. Power Apps ist eine Suite aus Apps, Diensten und Konnektoren und eine Datenplattform, die eine Umgebung für die schnelle Anwendungsentwicklung bereitstellt, in der Sie benutzerdefinierte Apps für Ihre Geschäftsanforderungen erstellen können. Mit Power Apps können Sie schnell benutzerdefinierte Geschäftsanwendungen erstellen, die eine Verbindung zu Ihren Daten in der zugrunde liegenden Datenplattform herstellen (Microsoft Dataverse), oder in vielen Online- und lokalen Datenquellen, wie z. B. SharePoint, Microsoft 365, Dynamics 365 und SQL Server.
  • Dataverse ist eine Betriebsdatenbank für Szenarien mit mehreren Agents. Es bietet Agents eine sichere, skalierbare Plattform zum Speichern von Statusdaten, Verlauf und Unterhaltungsdaten. Dieser zentralisierte Speicher ermöglicht es Agents, zu interagieren und Daten auszutauschen, sodass sie Aufgaben autonom oder halbautonom ausführen können. Dataverse ermöglicht es Agents außerdem, sich mit Geschäftsdaten in verschiedenen Geschäftsanwendungen wie CRM-Systemen zu verbinden und diese zu aktualisieren, sodass die Daten im gesamten Unternehmen konsistent und aktuell bleiben. Mit Dataverse erzielen Unternehmen bei der Verwaltung und Steuerung von Agent-Workflows Zuverlässigkeit, Sicherheit und erstklassige Betriebsprozesse.

Einzelheiten zum Szenario

Organisationen arbeiten mit strukturierten Dokumenten wie Formularen, Rechnungen, Quittungen und Ausweisdokumenten sowie mit unstrukturierten Dokumenten wie Memos, Verträgen und Kundenfeedbackanfragen. Eine zentrale Herausforderung für Unternehmen ist die Automatisierung der Dokumentenverarbeitung zur Optimierung von Geschäftsprozessen. Sie können mehrere Schritte automatisieren, einschließlich der Dokumenterfassung, Klassifizierung, Extraktion, Validierung, Transformation und des Exports. Die Verwendung eines Dokumentenverarbeitungsagenten bietet viele Vorteile gegenüber der herkömmlichen Dokumentenverarbeitung. Der Document Processing Agent funktioniert sofort als Paketlösung, sodass Sie während der Einrichtung keine zeitaufwändige Datenbeschriftung vornehmen müssen. Dank des interaktiven Designs können Sie große Mengen an Dokumenten unter menschlicher Aufsicht verarbeiten.

Überlegungen

Diese Überlegungen implementieren die Säulen von Power Platform Well-Architected, eine Reihe von Leitprinzipien, welche die Qualität einer Workload verbessern. Weitere Informationen finden Sie unter Microsoft Power Platform Well-Architected.

Zuverlässigkeit

Der Dokumentenverarbeitungs-Agent ist auf Ausfallsicherheit, Wiederherstellung und Betriebsvorgänge unter Verwendung von in Azure gehosteten Power Platform-Komponenten ausgelegt.

Sicherheit

Der Dokumentenverarbeitungs-Agent wurde entwickelt, um die Vertraulichkeit, Integrität und Datenverfügbarkeit zu schützen, indem er in Azure gehostete Power Platform-Komponenten verwendet. Dokumente, die in die Tabelle „Datenverarbeitungsereignisse“ importiert wurden, sind nur für Systemadministratoren sichtbar. Es werden keine zusätzlichen Daten, außer angehängten Dokumenten, wie E-Mail-Text oder -Betreff, in Dataverse gespeichert. Alle kundenbezogenen Informationen, die einem Dokument zugeordnet sind, werden in der Spalte „Verarbeitete Daten“ der Tabelle „Datenverarbeitungsereignisse“ gespeichert. Sie können DSGVO-Anforderungen bearbeiten, indem Sie diese Spalte abfragen.

Betriebliche Effizienz

Der Dokumentenverarbeitungs-Agent wurde entwickelt, um Vorgänge durch Überwachung und Erkenntnisse zu verbessern und mithilfe von Power Platform-Komponenten, die in Azure gehostet werden, Effizienz durch Automatisierung zu erreichen.

Leistungsfähigkeit

Der Dokumentenverarbeitungs-Agent ist darauf ausgelegt, Leistung durch Optimierung zu erreichen, indem er Power Platform-Komponenten verwendet, die in Azure gehostet werden. Der Dokumentenverarbeitungsagent unterstützt die Verarbeitung von Dokumenten mit einer Größe von bis zu 20 MB. Nach dem neuesten Benchmark dauert es etwa 48 Sekunden, um ein einzelnes Dokument mit einer Größe von 2 MB zu verarbeiten. Der Agent ist so konzipiert, dass er diese Verarbeitungsdauer für mehr als 1.000 Dokumente aufrechterhalten kann, vorausgesetzt, die ausgewählte Dokumentquelle verfügt über ausreichend Speicherplatz. Weitere Kontingente und Einschränkungen finden Sie unter Einschränkungen – Power Automate.

Optimierte Erfahrung

Der Dokumentenverarbeitungs-Agent wurde für Benutzende in der Dokumentenverarbeitung entwickelt, um durch die Verwendung von Power Platform-Komponenten Einfachheit und Effizienz zu erreichen. Der Agent bietet konfigurierbare Funktionen zum Hinzufügen von Dokumentquellen und ermöglicht die Erweiterbarkeit zum Hinzufügen zusätzlicher Dokumentquellen.

Verantwortungsvolle KI

Der Dokumentenverarbeitungs-Agent dient dazu, verantwortungsvolle KI-Standards umzusetzen, indem er Power Platform-Komponenten wie Copilot Studio nutzt, die für auf generativer KI basierende Funktionen entwickelt wurden. Weitere Informationen: Häufig gestellte Fragen zu verantwortungsvoller KI für Copilot Studio.

Mitwirkende

Dieser Artikel wird von Microsoft gepflegt. Die folgenden Mitwirkenden haben diesen Artikel geschrieben.

Hauptautoren:

Nächste Schritte

  • Verbessern Sie den Konfigurationsablauf, damit Benutzer ihre Exporterfahrung anpassen können. Fügen Sie beispielsweise vordefinierte Power Platform-Konnektoren für den Export in Systeme wie SAP oder Salesforce hinzu, und ermöglichen Sie Benutzenden, das Schema an SAP- oder Salesforce-Tabelleneinträge anzupassen.
  • Verbessern Sie den Konfigurationsflow, damit Benutzer eine Verbindung zu mehreren Dokumentquellen, z. B. Outlook und SharePoint, gleichzeitig herstellen können.
  • Lassen Sie den Agent mehrere Dokumenttypen gleichzeitig bearbeiten, indem Sie das beim Exportieren verwendete Schema basierend auf dem Dokumenttyp dynamisch ändern.