Preguntes freqüents sobre el processament de documents
Aquest article consta de preguntes freqüents sobre el model de tractament documental en AI Builder. Si no trobeu la vostra pregunta aquí, reviseu la visió general del model d'IA de processament de documents o envieu la vostra pregunta a la Power Automate Comunitat per a AI Builder.
Amb el processament de documents, podeu crear un model d'IA personalitzat per extreure informació de diversos tipus de documents.
- L'opció Documents de plantilla fixa és ideal si els elements dels vostres documents es poden trobar en llocs similars. Normalment és el cas de factures, comandes de compra, comandes de lliurament i formularis fiscals.
- L'opció de documents generals és ideal per a qualsevol tipus de document, inclosos els admesos per la primera opció, però també contractes, declaracions de treball, cartes i altres. Aquesta opció pot ser més potent per extreure dades, però requereix un temps d'entrenament més llarg.
Més informació: Visió general del model de tractament documental
Els tipus de fitxer admesos són PDF, JPG i PNG.
El processament de documents pot extreure camps, taules i caselles de selecció dels documents.
Saber-ne més: Definir informació per extreure
Sí. El processament de documents pot extreure text imprès i manuscrit dels vostres documents.
Per a documents d'alta qualitat que utilitzin el mateix disseny, n'hi hauria d'haver prou amb cinc documents de mostra. Per a documents de baixa qualitat (per exemple, escanejats de mala qualitat, pot ser necessari més documents de mostra. Per millorar els resultats, utilitzeu de 15 a 20 documents d'exemple.
Un únic model de processament de formularis pot extreure informació de documents que tenen diferents dissenys o plantilles?
Sí. En utilitzar la característica de col·leccions, entreneu un únic model de processament de formularis per gestionar documents que tenen dissenys diferents.
Més informació: Agrupar documents per col·leccions
Cada formulari ha d'estar en un fitxer independent. Per exemple, si teniu un document PDF amb diverses factures, creeu un fitxer independent per a cada factura abans d'enviar-lo al model de tractament de documents.
També podeu especificar pàgines per al model de processament de documents a gestionar. D'aquesta manera, podeu aprofitar la funcionalitat del model per enllaçar pàgina per pàgina i processar un formulari a la vegada.
Més informació: Interval de pàgines
Vaig entrenar un model de processament de documents, però no estic obtenint bons resultats pel que fa a les dades extretes. Com puc millorar el model?
Si el vostre model retorna mals resultats després d'entrenar-lo, editeu-lo i proporcioneu més mostres per a l'entrenament. Com més mostres proporcioneu, més aprendrà el model d'IA a extreure dades dels vostres documents.
Més informació: Millora el rendiment del teu model de tractament documental
Podeu processar fins a 360 documents per entorn, cada 60 segons.
- Pot passar que alguns caràcters es confonguin: 0 (número) i O (lletra), 1 (número) i l (lletra), 4 (número) i A (lletra), entre d'altres.
- Pot passar que alguns caràcters sobre o propers a altres es reconeguin incorrectament: O (lletra) sobre una línia vertical es converteix en un 0 (nombre), 5 (número) sobre una línia es converteix en un $ (signe de dòlar americà), l_ (lletra minúscula, guió baix) es converteix en una L (lletra majúscula), i més.
- Pot passar que alguns caràcters de documents de mala qualitat es reconeguin incorrectament o no en absolut.
En els casos anteriors, no es pot fer res per AI Builder millorar el reconeixement. Demanem millorar la qualitat i el disseny del document d'origen per resoldre problemes similars.
Nota
Microsoft millora constantment la tecnologia OCR per detectar caràcters, de manera que aquests problemes passen amb menys freqüència.
Podeu crear fins a 200 col·leccions per model. No obstant això, la formació de models de documents generals amb desenes de col·leccions pot trigar diverses hores i, en rares ocasions, temps mort. Si el vostre model té un nombre elevat de col·leccions, espereu fins a 24 hores per completar la formació del model.
Actualment, no és possible crear un model en una solució.
Sí, els documents no estructurats, com ara contractes i cartes, s'admeten mitjançant el tractament de documents, mitjançant l'opció Documents generals.
Quines diferències hi ha entre el processament de documents, el processament de factures, el processament de rebuts, el lector de documents d'identitat, el lector de targetes de visita i el reconeixement de text?
Depenent de la vostra situació, és possible que hàgiu d'utilitzar un model concret o una combinació d'ells.
Utilitza el reconeixement de text quan vulguis extreure tot el text present en una imatge o un PDF. A continuació, per exemple, podeu cercar una paraula clau al text que s'extreu o crear algunes regles fixes per extreure determinats elements.
Si voleu extreure informació de factures, rebuts, passaports, permisos de conduir o targetes de visita, comenceu amb el model preconstruït corresponent:
- Processament de factures
- Tramitació de rebuts
- Lector de documents d'identitat (passaports i permisos de conduir)
- Lector de targetes de visita
Podeu utilitzar aquests models preconstruïts immediatament, sense haver de crear un model nou. Aquests models poden extreure informació comuna que es troba en el seu tipus de document corresponent.
Per a qualsevol altre tipus de document, podeu crear un model de processament de documents personalitzat per extreure els camps i les taules que necessiteu. Això també s'aplica si necessiteu informació addicional que no proporciona el model preconstruït.
Més informació: Model personalitzat de tractament de documents
Quina diferència hi ha entre AI Builder el processament de documents i el reconeixement de formularis de l'Azure?
AI Builder El processament de documents es basa en el reconeixement de formularis de l'Azure. Això proporciona a tots dos productes els últims avenços en Microsoft AI.
AI Builder forma part de Microsoft Power Platform. Això permet a qualsevol persona afegir IA a les aplicacions i l'automatització amb una interfície fàcil d'utilitzar. No cal que siguis desenvolupador ni científic de dades.
L'Azure Form Recognizer està dirigit a desenvolupadors professionals. Poden utilitzar API REST senzilles per afegir capacitats d'IA a les seves solucions de codi personalitzades.
Podeu començar a provar el processament de documents de forma gratuïta iniciant una prova. Després d'avaluar-lo, heu de comprar AI Builder crèdits per utilitzar el processament de documents. Cada pàgina que processeu amb processament de documents consumeix AI Builder crèdits, fins i tot si la pàgina no conté dades per extreure. AI Builder Els crèdits es poden adquirir mitjançant AI Builder complements.
Més informació: AI Builder llicències