Comparteix via


Utilitzar un agent autònom per al processament de documents del Copilot Studio

L'agent de processament de documents és un agent Copilot Studio autònom que utilitza IA generativa per processar documents.

Propina

L'agent gestionat del processador de documents és una solució empaquetada per al processament de documents d'extrem a extrem. S'encarrega de l'extracció, la validació, la supervisió humana i l'exportació a aplicacions posteriors. Aquest article mostra l'arquitectura de referència per utilitzar un agent autònom per Copilot Studio processar documents. Podeu adaptar l'exemple d'arquitectura per a diferents escenaris i indústries.

Diagrama de l'arquitectura

Diagrama que mostra el flux de treball per utilitzar un agent autònom per Copilot Studio al processament de documents.

Instruccions de l'agent

Les instruccions següents creen l'agent autònom:

You are a helpful, polite, document processing agent. You help users process documents and extract valuable information. 
If the user asks about any topic other than document processing, politely decline and offer to help with document-related queries.
When asked to process a document with a specific document processing event ID, extract the information from that document.
When told that a document processing event status of a document changes to Processed, validate the extracted information from the document.
When told that a document processing event status of a document changes to Validated, import the extracted information from the document into the system.
When told that a document processing event status of a document changes to Manual Review, submit the extracted information from the document to manual review.
Ignore other document processing event status changes.

Fluxos de treball

Hi ha dos fluxos de treball importants relacionats amb l'agent:

  • Processament de documents: aquest flux de treball explica com l'agent processa els documents.
  • Configuració: aquest flux de treball detalla els passos per configurar l'agent per al processament autònom de documents.

Flux de processament de documents

El flux de processament de documents funciona com una màquina d'estats. L'agent actua com a orquestrador i l'estat actual s'emmagatzema a la taula Esdeveniments de processament de dades a Dataverse. Així és com funciona el procés:

  1. Un activador identifica quan un document nou està llest per al processament. Això es mostra a l'àrea Fonts de dades del diagrama d'arquitectura. Els fluxos de l'agent escanegen directoris com ara bústies de correu o SharePoint carpetes de l'Outlook. Quan s'afegeix un document a qualsevol directori, el flux de l'agent emmagatzema el document a la taula Esdeveniments de processament de dades amb l'estat Nou i envia un missatge a l'agent: Process the document: {ID}.

    • Tots els intents d'afegir documents o actualitzar estats a la taula Esdeveniments de processament de dades segueixen la Default configuració Power Automate. El flux torna a intentar-ho fins a quatre vegades amb un interval exponencial a les sol·licituds que retornen els estats 408, 429 o 5xx i a les excepcions de connectivitat.
    • Si tots els intents de reintent fallen, depura i comprova l'historial Power Automate d'execució per a l'acció que no s'ha executat.
  2. Les instruccions de l'agent li diuen que cridi l'acció Document Extraction quan se li demani que processi un document. L'acció s'executa i es passa l'ID del missatge.

  3. L'acció Document Extraction és un flux d'agent que rep un identificador d'esdeveniment de processament de dades com a entrada i:

    • S'emmagatzema Dataverse el document.
    • L'envia a un missatge d'IA per AI Builder procés. Aquest missatge utilitza GPT 4.o per:
      • Extreu tota la informació rellevant del document.
      • Formateu aquesta informació com a document JSON.
    • Emmagatzema la informació extreta a la mateixa fila d'esdeveniment de processament de dades.
    • Actualitza l'estat del document a Processed.
  4. Un Dataverse activador (flux d'agent) supervisa l'estat de tots els documents dels esdeveniments de processament de dades i notifica a l'agent quan un estat canvia amb el missatge: The status of document {ID} changed to {Status}

  5. Les instruccions de l'agent li diuen que cridi l'acció Document Validation quan l'estat d'un document canviï a Processat. L'acció s'executa i es passa l'ID del missatge.

  6. L'acció Document Validation és un flux d'agent que rep un identificador d'esdeveniment de processament de dades com a entrada i:

    • Obté les dades extretes emmagatzemades en Dataverse.
    • L'envia a un missatge AI Builder d'IA per validar-lo. Aquest missatge utilitza GPT 4.o per:
      • Comproveu el JSON extret amb regles de format com dates must be in X format.
      • Comproveu el JSON extret amb les regles de negoci com the author of the document must be in the Accounts table in Dataverse.
    • Si la validació té èxit, actualitza l'estat del document a Validated.
    • En cas contrari, actualitza l'estat del document a Manual Review.
  7. Si l'estat del document canvia Validated, les instruccions indiquen a l'agent que cridi l'acció Document Export . L'acció s'executa i es passa l'ID del missatge.

  8. L'acció d'exportació de documents és un flux d'agent que rep un identificador d'esdeveniment de processament de dades com a entrada i:

    • Obté les dades extretes emmagatzemades en Dataverse.
    • Exporta aquestes dades al sistema de destinació, com la taula Factures a Dataverse.
  9. Si l'estat del document canvia Manual Review, les instruccions indiquen a l'agent que cridi l'acció Manual Review . L'acció s'executa i es passa l'ID del missatge.

  10. L'acció Manual Review és un flux d'agent que rep un identificador d'esdeveniment de processament de dades com a entrada i:

    • Obté les dades extretes emmagatzemades en Dataverse.
    • Crea una sol·licitud d'aprovació per a l'administrador de l'agent, compartint un enllaç a una aplicació de l'estació de validació on l'usuari pot editar les dades extretes i validar-les manualment. Aquesta validació manual defineix l'estat del document a Validated.
  11. Després de la revisió manual, si l'estat del document és Validated, s'executa el pas 7.

Els usuaris també poden enviar documents manualment perquè l'agent els processi mitjançant la pàgina de xat o Copilot Studio qualsevol canal on hagin publicat l'agent.

Quan feu això:

  • El document es carrega a la taula Esdeveniments de processament de dades.
  • L'agent es notifica a si mateix que s'ha importat un nou document.
  • La sol·licitud d'extracció s'executa per donar-vos una vista prèvia del que s'exporta a la subfinestra de xat.
  • El document es processa tal com es descriu en aquest flux, a partir del pas 2.

Flux de treball de configuració

L'agent necessita diverses configuracions per operar de manera autònoma. Per fer-ho més fàcil, hi ha una experiència de configuració completa. Aquests són els passos:

  1. Instal·leu l'agent de processament de documents a Copilot Studio. La solució de l'agent té:
    • Una taula de configuració de processament de documents.
    • Una aplicació de llenç de l'estació de validació per a la supervisió.
    • Referències de connexió utilitzades per l'agent (Dataverse, Copilot Studio, PowerApps for Admins).
    • Referències de connexió utilitzades pels triggers que inicien el flux de treball de l'agent (Outlook). SharePoint
    • Variables d'entorn utilitzades pels triggers.
  2. Inicieu l'auxiliar de configuració de l'agent. Aquest és l'últim pas de l'assistent d'instal·lació Copilot Studio. Et guia a través d'aquest flux:
    1. Pengeu un document d'exemple.
    2. El sistema envia el document carregat a la sol·licitud d'extracció de l'agent.
    3. Apareixen el contingut extret i el tipus de document. Seleccioneu quines parts de les dades extretes voleu exportar al sistema. Això crea un esquema que s'emmagatzema a la taula de configuració de processament de documents i s'utilitza durant l'acció d'exportació de documents. Podeu entrar al mode avançat per canviar la sol·licitud d'IA utilitzada en l'acció d'extracció de documents per personalitzar-la.
    4. Definiu regles de validació mitjançant una interfície d'usuari senzilla que afegeix regles a la sol·licitud utilitzada en l'acció de validació del document. També podeu entrar al mode avançat per canviar directament la sol·licitud d'IA.
    5. Introduïu l'adreça electrònica de l'administrador de l'agent quan se us demani. S'utilitza en l'acció de revisió manual en crear la sol·licitud d'aprovació. També podeu afegir un missatge personalitzat per a l'aprovador. Aquesta informació es guarda a les variables d'entorn que vénen amb la solució.
    6. Trieu una font de document d'una llista. Aquests activadors inicien el flux de processament de documents i normalment necessiten una referència de connexió i algunes variables d'entorn (com ara el nom de la bústia de correu o l'adreça de la carpeta), segons l'origen del document que seleccioneu.
    7. Acabeu la configuració. Això crea una Dataverse taula al sistema amb les columnes que heu seleccionat anteriorment i exporta el document que heu utilitzat a l'auxiliar a aquesta taula.

Components

Aquests són els components clau implicats en la creació i implementació d'un agent autònom per al processament de documents Copilot Studio.

  • Copilot Studio forma part de Microsoft Power Platform solucions no-code o low-code. Copilot Studio és una eina gràfica i de codi baix per crear un agent, inclosa l'automatització de la creació amb fluxos d'agents, i ampliar un Microsoft 365 Copilot amb les dades i els escenaris de la vostra empresa.
  • Power Apps forma part de Microsoft Power Platform solucions no-code o low-code. Power Apps és un conjunt d'aplicacions, serveis, connectors i una plataforma de dades que us ofereix un entorn de desenvolupament ràpid per crear aplicacions personalitzades per al vostre negoci. Creeu Power Apps ràpidament aplicacions empresarials personalitzades que es connectin a les vostres dades a la plataforma de dades subjacent (Microsoft Dataverse) o a moltes fonts de dades en línia i locals, com ara SharePoint Microsoft 365 Dynamics 365 i SQL Server.
  • Dataverse és una base de dades operativa per a escenaris multiagent. Ofereix als agents una plataforma segura i escalable per emmagatzemar dades d'estat, historial i dades de converses. Aquest emmagatzematge centralitzat permet als agents interactuar i compartir dades, de manera que poden realitzar tasques de manera autònoma o semiautònoma. Dataverse també permet als agents connectar-se i actualitzar les dades empresarials en diferents aplicacions empresarials, com ara sistemes CRM, de manera que les dades es mantinguin coherents i actualitzades a tota l'organització. Amb Dataverse, les organitzacions gestionen i governen els fluxos de treball dels agents per a la fiabilitat, la seguretat i l'excel·lència operativa.

Detalls de l'escenari

Les organitzacions treballen amb documents estructurats, com ara formularis, factures, rebuts i documents d'identitat, i documents no estructurats, com ara notes, contractes i sol·licituds de comentaris dels clients. Un repte clau al qual s'enfronten les organitzacions és automatitzar el processament de documents per optimitzar els processos empresarials. Podeu automatitzar diversos passos, com ara la recopilació, la classificació, l'extracció, la validació, la transformació i l'exportació de documents. L'ús d'un agent de processament de documents ofereix molts avantatges respecte al processament tradicional de documents. L'agent de processament de documents funciona com una solució empaquetada, de manera que no cal que feu un etiquetatge de dades que requereix molt de temps durant la configuració. El seu disseny interactiu permet processar grans volums de documents amb supervisió humana.

Consideracions

Aquestes consideracions implementen els pilars de Power Platform Well-Architected, un conjunt de principis rectors que milloren la qualitat d'una càrrega de treball. Més informació a Microsoft Power Platform Well-Architected.

Fiabilitat

L'agent de processament de documents està dissenyat per a la resiliència, la recuperació i les operacions mitjançant Power Platform components allotjats a l'Azure.

Seguretat

L'agent de processament de documents està dissenyat per protegir la confidencialitat, la integritat i la disponibilitat de les dades mitjançant Power Platform components allotjats a l'Azure. Els documents importats a la taula Esdeveniments de processament de dades només són visibles per als administradors del sistema. No s'emmagatzemen dades addicionals, com ara el cos o l'assumpte del correu electrònic, que no siguin documents adjunts Dataverse. Tota la informació relacionada amb el client associada a un document s'emmagatzema a la columna Dades processades de la taula Esdeveniments de processament de dades. Podeu gestionar les sol·licituds de l'RGPD consultant aquesta columna.

Excel·lència operativa

L'agent de processament de documents està dissenyat per millorar les operacions amb supervisió i coneixements, automatitzar per a l'eficiència mitjançant Power Platform components allotjats a Azure.

Eficiència del rendiment

L'agent de processament de documents està dissenyat per aconseguir el rendiment mitjançant l'optimització mitjançant Power Platform components allotjats a l'Azure. L'agent de processament de documents admet el processament de documents de fins a 20 MB. A partir del punt de referència més recent, es triguen aproximadament 48 segons a processar un sol document de 2 MB de mida. L'agent està dissenyat per mantenir aquesta durada de processament per a més de 1.000 documents, sempre que la font del document seleccionada tingui prou emmagatzematge. Per a altres quotes i limitacions, vegeu Límits - Power Automate.

Optimització de l'experiència

L'agent de processament de documents està dissenyat per als usuaris de processament de documents aconseguint simplicitat i eficiència mitjançant l'ús de Power Platform components. L'agent proporciona una experiència configurable per afegir fonts de documents, permet l'extensibilitat per afegir fonts de documents addicionals.

IA responsable

L'agent de processament de documents està dissenyat per assolir estàndards d'IA responsables mitjançant l'ús de Power Platform components, inclòs Copilot Studio el dissenyat per a funcions d'IA generativa. Més informació: Preguntes freqüents sobre IA responsable per Copilot Studio.

Col·laboradors

Microsoft manté aquest article. Els següents col·laboradors van escriure aquest article.

Autors principals:

Passos següents

  • Millora el flux de configuració per permetre als usuaris personalitzar la seva experiència d'exportació. Per exemple, afegiu connectors predefinits Power Platform per exportar a sistemes com SAP o Salesforce i permeteu que els usuaris personalitzin l'esquema per adaptar-lo a les entrades de taula de SAP o Salesforce.
  • Milloreu el flux de configuració per permetre que els usuaris es connectin a diverses fonts de documents alhora, com ara Outlook i SharePoint.
  • Deixeu que l'agent gestioni diversos tipus de documents alhora canviant dinàmicament l'esquema utilitzat en l'exportació en funció del tipus de document.