Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Der Dokumentenverarbeitungs-Agent ist ein autonomer Agent in Copilot Studio, der generative KI zum Verarbeiten von Dokumenten verwendet.
Tipp
Der verwaltete Agent Dokumentenverarbeiter ist eine Paketlösung für die End-to-End-Dokumentenverarbeitung. Es übernimmt die Extraktion, Validierung, menschliche Überwachung und den Export in nachgelagerte Apps. Dieser Artikel zeigt die Referenzarchitektur für die Verwendung eines autonomen Agents in Copilot Studio zur Verarbeitung von Dokumenten. Sie können das Architekturbeispiel für verschiedene Szenarien und Branchen anpassen.
Architekturdiagramm
Agent-Anweisungen
Mit den folgenden Anweisungen wird der autonome Agent erstellt:
You are a helpful, polite, document processing agent. You help users process documents and extract valuable information.
If the user asks about any topic other than document processing, politely decline and offer to help with document-related queries.
When asked to process a document with a specific document processing event ID, extract the information from that document.
When told that a document processing event status of a document changes to Processed, validate the extracted information from the document.
When told that a document processing event status of a document changes to Validated, import the extracted information from the document into the system.
When told that a document processing event status of a document changes to Manual Review, submit the extracted information from the document to manual review.
Ignore other document processing event status changes.
Workflows
Es gibt zwei wichtige Workflows im Zusammenhang mit dem Agenten:
- Dokumentenverarbeitung: In diesem Workflow wird erläutert, wie der Agent Dokumente verarbeitet.
- Konfiguration: Dieser Workflow beschreibt die Schritte zum Einrichten des Agents für die autonome Dokumentenverarbeitung.
Dokumentenverarbeitungsflow
Der Dokumentenverarbeitungsablauf funktioniert wie ein Zustandsautomat. Der Agent fungiert als Orchestrator. Der aktuelle Status wird in der Tabelle „Datenverarbeitungsereignisse“ in Dataverse gespeichert. So funktioniert der Prozess:
Ein Trigger identifiziert, wann ein neues Dokument zur Verarbeitung bereit ist. Dies wird im Bereich Datenquellen im Architekturdiagramm angezeigt. Agent-Flows durchsuchen Verzeichnisse wie Outlook-Postfächer oder SharePoint-Ordner. Wenn ein Dokument irgendeinem Verzeichnis hinzugefügt wird, speichert der Agent-Flow es in der Tabelle „Datenverarbeitungsereignisse“ mit dem Status „Neu“ und sendet eine Nachricht an den Agent:
Process the document: {ID}.- Alle Versuche, Dokumente hinzuzufügen oder den Status in der Tabelle „Datenverarbeitungsereignisse“ zu aktualisieren, folgen der
Default-Konfiguration in Power Automate. Der Flow wird bis zu viermal mit einem exponentiellen Intervall für Anforderungen wiederholt, die den Status 408, 429 oder 5xx zurückgeben, sowie für alle Konnektivitätsausnahmen. - Wenn alle Wiederholversuche fehlschlagen, debuggen und überprüfen Sie den Ausführungsverlauf in Power Automate für die Aktion, die nicht ausgeführt werden konnte.
- Alle Versuche, Dokumente hinzuzufügen oder den Status in der Tabelle „Datenverarbeitungsereignisse“ zu aktualisieren, folgen der
Die Agent-Anweisungen weisen ihn an, die
Document Extraction-Aktion aufzurufen, wenn er aufgefordert wird, ein Dokument zu verarbeiten. Die Aktion wird ausgeführt, und die Nachrichten-ID wird übergeben.Bei der
Document Extraction-Aktion handelt es sich um einen Agent-Flow, der eine Datenverarbeitungsereignis-ID als Eingabe erhält und:- dafür sorgt, dass das Dokument in Dataverse gespeichert wird.
- es an einen KI-Prompt in AI Builder zur Verarbeitung sendet. Dieser Prompt nutzt GPT 4.o für folgende Aufgaben:
- Extrahieren aller relevanten Informationen aus dem Dokument
- Formatieren dieser Informationen als JSON-Dokument
- Speichert die extrahierten Informationen in derselben Datenverarbeitungsereigniszeile.
- aktualisiert den Status des Dokuments auf
Processed.
Ein Dataverse-Trigger (Agent-Flow) überwacht den Status aller Dokumente in den Datenverarbeitungsereignissen und benachrichtigt den Agent, wenn sich ein Status ändert, mit der folgenden Nachricht:
The status of document {ID} changed to {Status}Die Agent-Anweisungen weisen ihn an, die
Document Validation-Aktion aufzurufen, wenn sich der Status des Dokuments in Verarbeitet ändert. Die Aktion wird ausgeführt, und die Nachrichten-ID wird übergeben.Bei der Aktion
Document Validationhandelt es sich um einen Agent-Flow, der eine Datenverarbeitungsereignis-ID als Eingabe erhält und:- die extrahierten Daten abruft, die in Dataverse gespeichert sind.
- sie an einen KI-Prompt in AI Builder zur Validierung sendet. Dieser Prompt nutzt GPT 4.o für folgende Aufgaben:
- Überprüfung des extrahierten JSONs anhand von Formatregeln wie
dates must be in X format - Überprüfung des extrahierten JSONs anhand von Geschäftsregeln wie
the author of the document must be in the Accounts table in Dataverse
- Überprüfung des extrahierten JSONs anhand von Formatregeln wie
- Wenn die Validierung erfolgreich ist, wird der Status des Dokuments auf
Validatedaktualisiert. - Andernfalls wird der Status des Dokuments auf
Manual Reviewaktualisiert.
Wenn sich der Status des Dokuments in
Validatedändert, ruft der Agent gemäß der Anweisungen dieDocument Export-Aktion auf. Die Aktion wird ausgeführt, und die Nachrichten-ID wird übergeben.Bei der Aktion „Dokumentexport“ handelt es sich um einen Agent-Fluss, der eine Datenverarbeitungsereignis-ID als Eingabe erhält und:
- die extrahierten Daten abruft, die in Dataverse gespeichert sind.
- diese Daten in das Zielsystem exportiert, z. B. in die Tabelle „Rechnungen“ in Dataverse.
Wenn sich der Status des Dokuments in
Manual Reviewändert, ruft der Agent gemäß der Anweisungen dieManual Review-Aktion auf. Die Aktion wird ausgeführt, und die Nachrichten-ID wird übergeben.Bei der
Manual Review-Aktion handelt es sich um einen Agent-Flow, der eine Datenverarbeitungsereignis-ID als Eingabe erhält und:- die extrahierten Daten abruft, die in Dataverse gespeichert sind.
- eine Genehmigungsanforderung für die Fachkraft für die Agent-Administration erstellt und eine Verknüpfung zu einer Validierungsstation-App freigibt, wo der Benutzende extrahierte Daten bearbeiten und manuell prüfen kann. Diese manuelle Prüfung legt den Status des Dokuments auf
Validatedfest.
Wenn der Status des Dokuments nach der manuellen Überprüfung
Validatedlautet, wird Schritt 7 ausgeführt.
Benutzende können Dokumente auch manuell über die Chatseite in Copilot Studio oder einen beliebigen Kanal, in dem sie den Agent veröffentlicht haben, zur Verarbeitung an den Agent übermitteln.
Beachten Sie in diesem Fall Folgendes:
- Das Dokument wird in die Tabelle „Datenverarbeitungsereignisse“ hochgeladen.
- Der Agent benachrichtigt sich selbst, dass ein neues Dokument importiert wurde.
- Die Eingabeaufforderung zum Extrahieren wird ausgeführt, um Ihnen eine Vorschau dessen zu geben, was im Chatbereich exportiert wird.
- Das Dokument wird wie in diesem Ablauf ab Schritt 2 beschrieben verarbeitet.
Konfigurationsworkflow
Der Agent benötigt mehrere Konfigurationen, um autonom zu arbeiten. Um dies zu vereinfachen, gibt es eine umfassende Konfigurationsoberfläche. Gehen Sie folgendermaßen vor:
- Installieren Sie den Dokumentenverarbeitungs-Agent in Copilot Studio. Die Agent-Lösung verfügt über Folgendes:
- Eine Konfigurationstabelle für die Dokumentenverarbeitung
- Eine Validierungsstation-Canvas-App für die Überwachung
- Vom Agent verwendete Verbindungsreferenzen (Dataverse, Copilot Studio, PowerApps for Admins)
- Von den Triggern, die den Agent-Workflow starten, verwendete Verbindungsreferenzen (Outlook, SharePoint)
- Von den Triggern verwendete Umgebungsvariablen
- Starten Sie den Assistenten für die Agent-Konfiguration. Dies ist der letzte Schritt des Installationsassistenten in Copilot Studio. Er leitet Sie durch diesen Flow:
- Laden Sie ein Beispieldokument hoch.
- Das System sendet das hochgeladene Dokument an die Extraktionsaufforderung des Agenten.
- Der extrahierte Inhalt und der Dokumenttyp werden angezeigt. Wählen Sie aus, welche Teile der extrahierten Daten Sie in das System exportieren möchten. Dadurch wird ein Schema erstellt, das in der Konfigurationstabelle für die Dokumentverarbeitung gespeichert und während der Dokumentexportaktion verwendet wird. Sie können in den erweiterten Modus wechseln, um die in der Dokumentextraktionsaktion verwendete KI-Eingabeaufforderung zu ändern und anzupassen.
- Definieren Sie Validierungsregeln über eine einfache Benutzeroberfläche, die der in der Dokumentvalidierungsaktion verwendeten Eingabeaufforderung Regeln hinzufügt. Sie können auch in den erweiterten Modus wechseln, um die KI-Eingabeaufforderung direkt zu ändern.
- Geben Sie die E-Mail-Adresse des Agent-Administrators ein, wenn Sie dazu aufgefordert werden. Dies wird in der manuellen Überprüfungsaktion beim Erstellen der Genehmigungsanforderung verwendet. Sie können auch eine benutzerdefinierte Nachricht für die genehmigende Person hinzufügen. Diese Informationen werden in den Umgebungsvariablen gespeichert, die im Lieferumfang der Lösung enthalten sind.
- Wählen Sie eine Dokumentquelle aus einer Liste aus. Diese Trigger starten den Dokumentverarbeitungsfluss und benötigen in der Regel eine Verbindungsreferenz und einige Umgebungsvariablen (z. B. Postfachname oder Ordneradresse), je nach ausgewählter Dokumentquelle.
- Beenden Sie die Konfiguration. Dadurch wird im System eine Dataverse-Tabelle mit den zuvor ausgewählten Spalten angelegt und das Dokument, das Sie im Assistenten verwendet haben, wird in diese Tabelle exportiert.
Komponenten
Hier sind die wichtigsten Komponenten, die an der Erstellung und Bereitstellung eines autonomen Agents für die Dokumentenverarbeitung in Copilot Studio beteiligt sind.
- Copilot Studio gehört zu den No-Code- oder Low-Code-Lösungen von Microsoft Power Platform. Copilot Studio ist ein grafisches Low-Code-Tool zum Erstellen eines Agents – dazu gehört auch das Erstellen von Automatisierung mit Agent-Flows – und zum Erweitern eines Microsoft 365 Copilot mit Ihren Unternehmensdaten und -szenarien.
- Power Apps gehört zu den No-Code- oder Low-Code-Lösungen von Microsoft Power Platform. Power Apps ist eine Suite aus Apps, Diensten und Konnektoren und eine Datenplattform, die eine Umgebung für die schnelle Anwendungsentwicklung bereitstellt, in der Sie benutzerdefinierte Apps für Ihre Geschäftsanforderungen erstellen können. Mit Power Apps können Sie schnell benutzerdefinierte Geschäftsanwendungen erstellen, die eine Verbindung zu Ihren Daten in der zugrunde liegenden Datenplattform herstellen (Microsoft Dataverse), oder in vielen Online- und lokalen Datenquellen, wie z. B. SharePoint, Microsoft 365, Dynamics 365 und SQL Server.
- Dataverse ist eine Betriebsdatenbank für Szenarien mit mehreren Agents. Es bietet Agents eine sichere, skalierbare Plattform zum Speichern von Statusdaten, Verlauf und Unterhaltungsdaten. Dieser zentralisierte Speicher ermöglicht es Agents, zu interagieren und Daten auszutauschen, sodass sie Aufgaben autonom oder halbautonom ausführen können. Dataverse ermöglicht es Agents außerdem, sich mit Geschäftsdaten in verschiedenen Geschäftsanwendungen wie CRM-Systemen zu verbinden und diese zu aktualisieren, sodass die Daten im gesamten Unternehmen konsistent und aktuell bleiben. Mit Dataverse erzielen Unternehmen bei der Verwaltung und Steuerung von Agent-Workflows Zuverlässigkeit, Sicherheit und erstklassige Betriebsprozesse.
Einzelheiten zum Szenario
Organisationen arbeiten mit strukturierten Dokumenten wie Formularen, Rechnungen, Quittungen und Ausweisdokumenten sowie mit unstrukturierten Dokumenten wie Memos, Verträgen und Kundenfeedbackanfragen. Eine zentrale Herausforderung für Unternehmen ist die Automatisierung der Dokumentenverarbeitung zur Optimierung von Geschäftsprozessen. Sie können mehrere Schritte automatisieren, einschließlich der Dokumenterfassung, Klassifizierung, Extraktion, Validierung, Transformation und des Exports. Die Verwendung eines Dokumentenverarbeitungsagenten bietet viele Vorteile gegenüber der herkömmlichen Dokumentenverarbeitung. Der Document Processing Agent funktioniert sofort als Paketlösung, sodass Sie während der Einrichtung keine zeitaufwändige Datenbeschriftung vornehmen müssen. Dank des interaktiven Designs können Sie große Mengen an Dokumenten unter menschlicher Aufsicht verarbeiten.
Überlegungen
Diese Überlegungen implementieren die Säulen von Power Platform Well-Architected, eine Reihe von Leitprinzipien, welche die Qualität einer Workload verbessern. Weitere Informationen finden Sie unter Microsoft Power Platform Well-Architected.
Zuverlässigkeit
Der Dokumentenverarbeitungs-Agent ist auf Ausfallsicherheit, Wiederherstellung und Betriebsvorgänge unter Verwendung von in Azure gehosteten Power Platform-Komponenten ausgelegt.
Sicherheit
Der Dokumentenverarbeitungs-Agent wurde entwickelt, um die Vertraulichkeit, Integrität und Datenverfügbarkeit zu schützen, indem er in Azure gehostete Power Platform-Komponenten verwendet. Dokumente, die in die Tabelle „Datenverarbeitungsereignisse“ importiert wurden, sind nur für Systemadministratoren sichtbar. Es werden keine zusätzlichen Daten, außer angehängten Dokumenten, wie E-Mail-Text oder -Betreff, in Dataverse gespeichert. Alle kundenbezogenen Informationen, die einem Dokument zugeordnet sind, werden in der Spalte „Verarbeitete Daten“ der Tabelle „Datenverarbeitungsereignisse“ gespeichert. Sie können DSGVO-Anforderungen bearbeiten, indem Sie diese Spalte abfragen.
Betriebliche Effizienz
Der Dokumentenverarbeitungs-Agent wurde entwickelt, um Vorgänge durch Überwachung und Erkenntnisse zu verbessern und mithilfe von Power Platform-Komponenten, die in Azure gehostet werden, Effizienz durch Automatisierung zu erreichen.
Leistungsfähigkeit
Der Dokumentenverarbeitungs-Agent ist darauf ausgelegt, Leistung durch Optimierung zu erreichen, indem er Power Platform-Komponenten verwendet, die in Azure gehostet werden. Der Dokumentenverarbeitungsagent unterstützt die Verarbeitung von Dokumenten mit einer Größe von bis zu 20 MB. Nach dem neuesten Benchmark dauert es etwa 48 Sekunden, um ein einzelnes Dokument mit einer Größe von 2 MB zu verarbeiten. Der Agent ist so konzipiert, dass er diese Verarbeitungsdauer für mehr als 1.000 Dokumente aufrechterhalten kann, vorausgesetzt, die ausgewählte Dokumentquelle verfügt über ausreichend Speicherplatz. Weitere Kontingente und Einschränkungen finden Sie unter Einschränkungen – Power Automate.
Optimierte Erfahrung
Der Dokumentenverarbeitungs-Agent wurde für Benutzende in der Dokumentenverarbeitung entwickelt, um durch die Verwendung von Power Platform-Komponenten Einfachheit und Effizienz zu erreichen. Der Agent bietet konfigurierbare Funktionen zum Hinzufügen von Dokumentquellen und ermöglicht die Erweiterbarkeit zum Hinzufügen zusätzlicher Dokumentquellen.
Verantwortungsvolle KI
Der Dokumentenverarbeitungs-Agent dient dazu, verantwortungsvolle KI-Standards umzusetzen, indem er Power Platform-Komponenten wie Copilot Studio nutzt, die für auf generativer KI basierende Funktionen entwickelt wurden. Weitere Informationen: Häufig gestellte Fragen zu verantwortungsvoller KI für Copilot Studio.
Mitwirkende
Dieser Artikel wird von Microsoft gepflegt. Die folgenden Mitwirkenden haben diesen Artikel geschrieben.
Hauptautoren:
- Jaganmohan Naidu Penikalapati, Leitender Manager für Softwareentwicklung
- Ceren Kiroglu, Senior Product Manager
- Durga Yelavarthi, Hauptarchitekt
- Jo Ruas, SoftwareTechniker
Zugehörige Ressourcen
- Verwalteten Agent von Microsoft installieren
- Agents im Einsatz: Dokumentenverarbeitung 2.0
- So funktionieren Agent-Unterhaltungen
Nächste Schritte
- Verbessern Sie den Konfigurationsablauf, damit Benutzer ihre Exporterfahrung anpassen können. Fügen Sie beispielsweise vordefinierte Power Platform-Konnektoren für den Export in Systeme wie SAP oder Salesforce hinzu, und ermöglichen Sie Benutzenden, das Schema an SAP- oder Salesforce-Tabelleneinträge anzupassen.
- Verbessern Sie den Konfigurationsflow, damit Benutzer eine Verbindung zu mehreren Dokumentquellen, z. B. Outlook und SharePoint, gleichzeitig herstellen können.
- Lassen Sie den Agent mehrere Dokumenttypen gleichzeitig bearbeiten, indem Sie das beim Exportieren verwendete Schema basierend auf dem Dokumenttyp dynamisch ändern.