Notă
Accesul la această pagină necesită autorizare. Puteți încerca să vă conectați sau să modificați directoarele.
Accesul la această pagină necesită autorizare. Puteți încerca să modificați directoarele.
Acest articol constă în întrebări frecvente despre modelul de procesare a documentelor în AI Builder. Dacă nu găsiți întrebarea dvs. aici, examinați Prezentarea generală a modelului AI de procesare a documentelor sau trimiteți întrebarea Power Automate Comunității pentru AI Builder.
Funcționalitate
Ce pot face cu procesarea documentelor?
Cu procesarea documentelor, puteți construi un model AI personalizat pentru a extrage informații din diferite tipuri de documente.
- Opțiunea Documente cu șablon fix este ideală dacă elementele documentelor dvs. pot fi găsite în locuri similare. Este, de obicei, cazul facturilor, comenzilor de cumpărare, comenzilor de livrare și formularelor fiscale.
- Opțiunea Documente generale este ideală pentru orice tip de document, inclusiv cele susținute de prima opțiune dar și contracte, declarație de lucru, scrisori și altele. Această opțiune poate fi mai puternică pentru a extrage date, dar necesită un timp de antrenament mai lung.
Aflați mai multe în Prezentare generală asupra modelului de procesare a documentelor.
Ce tipuri de documente poate gestiona procesarea documentelor?
Tipurile de fișiere acceptate sunt PDF, JPG și PNG.
Ce date pot extrage din documente utilizând procesarea documentelor?
Procesarea documentelor poate extrage câmpuri, tabele și casete de selectare din documente.
Aflați mai multe în Definiți informații de extras.
Pot extrage text scris de mână din documente?
Da. Procesarea documentelor poate extrage text tipărit și scris de mână din documentele dvs.
De câte mostre am nevoie pentru a instrui un model de procesare a documentelor?
Pentru documente de înaltă calitate care utilizează același aspect, cinci documente eșantion ar trebui să fie suficiente. Pentru documente de calitate scăzută (de exemplu, scanări de proastă calitate), ar putea fi necesare mai multe exemple de documente. Pentru a îmbunătăți rezultatele, utilizați 15 până la 20 de documente eșantion.
Cele mai bune practici
Pentru documente șablon
- Un (1) aspect per colecție.
- Aspectul trebuie să fie identic în cadrul aceleiași colecții.
- Minim cinci (5) și maxim 20 de documente per colecție (nu depășiți această limită).
Pentru documente generale
Creați un singur model pentru toate variantele unui tip de document, inclusiv documente structurate și nestructurate.
Etichetați câmpurile relevante pentru valorile lor pentru o precizie mai bună a extracției.
De exemplu, utilizați „furnizor_id” pentru un ID de furnizor. Numele câmpurilor trebuie să corespundă cu limba documentului.
Minim cinci (5) și maxim 20 de documente per colecție (nu depășiți această limită).
Modelul meu este publicat în prezent în v3.1 (GA) și intenționez să-l reantrenez folosind v4.0 (GA). Este necesar să reetichet toate documentele mele?
Cu excepția cazului în care adăugați noi câmpuri, casete de selectare, tabele, semnături pentru extragerea datelor sau documente noi la colecție, nu trebuie să reetichetați toate documentele.
Înainte de a publica modelul, este recomandat să testați rapid modelul folosind unul sau mai multe eșantioane pentru a verifica și a vă asigura că toate câmpurile dorite sunt extrase corect.
Pot trece de la un tip de document la altul?
Da, atunci când editați modelul, puteți comuta între un tip de document șablon fix și un tip de document general. Cu toate acestea, această comutare nu este acceptată pentru facturi.
Poate un singur model de procesare a formularelor să extragă informații din documente care au machete sau șabloane diferite?
Da. Folosind funcția de colecții, antrenați un singur model de procesare a formularelor pentru a gestiona documente care au aspecte diferite.
Aflați mai multe în Grupați documentele după colecții.
Procesarea documentelor poate gestiona forme multiple într-un un singur document?
Fiecare formular trebuie să fie într-un fișier separat. De exemplu, dacă aveți un document PDF cu mai multe facturi în el, creați un fișier separat pentru fiecare factură înainte de a-l trimite la modelul de procesare a documentelor.
De asemenea, puteți specifica pagini pentru modelul de procesare a documentelor de tratat. În acest fel, puteți profita de funcționalitatea modelului pentru a bucla pagină cu pagină și a procesa un formular la un moment dat.
Aflați mai multe în Interval de pagini.
Am antrenat un model de procesare a documentelor, dar nu obțin rezultate bune când vine vorba de datele extrase. Cum pot îmbunătăți modelul?
Dacă modelul dvs. dă rezultate slabe după ce l-ați antrenat, editați modelul și furnizați mai multe mostre pentru antrenament. Cu cât oferiți mai multe mostre, cu atât mai mult modelul AI învață cum să extragă date din documentele dvs.
Aflați mai multe în Îmbunătățiți performanța modelului dvs. de procesare a documentelor.
Limitări
Care este numărul maxim de documente pe care le pot procesa?
Puteți procesa până la 360 de documente per mediu, la fiecare 60 de secunde.
De ce unele caractere sunt recunoscute incorect?
- Se poate întâmpla ca unele caractere să se confunde: 0 (număr) și O (litera), 1 (cifra) și l (litera), 4 (cifra) și A (litera) și multe altele.
- Se poate întâmpla ca unele caractere peste sau apropiate de altele să fie recunoscute incorect: O (litera) peste o linie verticală devine 0 (număr), 5 (cifra) peste o linie devine $ (semnul dolarului american), l_ (litera mică, liniuța de subliniere) devine L (litera mare) și multe altele.
- Se poate întâmpla ca unele caractere de pe documente de proastă calitate să fie recunoscute incorect sau deloc.
În cazurile anterioare, nu se poate face nimic în AI Builder pentru a îmbunătăți recunoașterea. Vă recomandăm să îmbunătățiți calitatea și aspectul documentului sursă pentru a rezolva probleme similare.
Notă
Microsoft îmbunătățește constant tehnologia de recunoaștere optică a caracterelor (OCR) pentru a detecta caracterele, astfel încât astfel de probleme apar mai rar.
Pot crea un model cu multe colecții?
Puteți crea până la 200 de colecții per model. Cu toate acestea, antrenamentul Documente generale modelele cu zeci de colecții pot dura câteva ore și, în rare ocazii, pot dura. Dacă modelul dvs. are un număr mare de colecții, așteptați-vă să așteptați până la 24 de ore pentru finalizarea instruirii modelului.
Pot crea un model într-o soluție?
În prezent, nu este posibil să se creeze un model într-o soluție.
Pot folosi contracte și scrisori în modelul meu de procesare a documentelor?
Da, documentele nestructurate precum contractele și scrisorile sunt susținute de procesarea documentelor, folosind Documente generale opţiune.
Comparații
Care sunt diferențele dintre procesarea documentelor, procesarea facturilor, procesarea chitanțelor, cititorul documentelor de identitate, cititorul cărților de vizită și recunoașterea textului?
În funcție de situația dvs., poate fi necesar să utilizați un anumit model sau o combinație a acestora.
Utilizare recunoașterea textului atunci când doriți să extrageți tot textul prezent într-o imagine sau într-un PDF. Puteți apoi, de exemplu, să căutați un cuvânt cheie în textul care este extras sau să construiți niște reguli fixe pentru a extrage anumite elemente.
Dacă doriți să extrageți informații din facturi, chitanțe, pașapoarte, permise de conducere sau cărți de vizită, începeți cu modelul predefinit corespunzător:
- Procesarea facturii
- Prelucrare chitanță
- Cititor de documente de identitate (pașapoarte și permise de conducere)
- Cititor de cărți de vizită
Puteți utiliza aceste modele prefabricate imediat, fără a fi nevoie să creați un model nou. Aceste modele pot extrage informații comune găsite în tipul lor de document corespunzător.
Pentru orice alt tip de document, puteți crea un model personalizat de procesare a documentelor pentru a extrage câmpurile și tabelele de care aveți nevoie. Acest lucru se aplică și dacă aveți nevoie de informații suplimentare care nu sunt furnizate de modelul prefabricat.
Aflați mai multe în Model personalizat de procesare a documentelor.
Care este diferența dintre AI Builder procesarea documentelor și Azure Form Recognizer?
AI Builder procesarea documentelor este construită pe baza Azure Form Recognizer. Acest lucru oferă ambelor produse cele mai recente progrese în Microsoft AI.
AI Builder face parte din Microsoft Power Platform. Acest lucru permite oricui să adauge AI în aplicații și automatizări cu o interfață ușor de utilizat. Nu trebuie să fiți dezvoltator sau cercetător de date.
Azure Form Recognizer este direcționat dezvoltatorilor profesioniști. Ei pot folosi API-uri REST simple pentru a adăuga capabilități AI la soluțiile lor de cod personalizat.
Opțiuni de cost
Cât costă AI Builder procesarea documentelor?
Puteți începe să încercați gratuit procesarea documentelor, pornind o probă. După ce îl evaluați, trebuie să achiziționați AI Builder credite pentru a utiliza procesarea documentelor. Fiecare pagină pe care o procesați cu procesarea documentelor consumă AI Builder credite, chiar dacă pagina nu conține date de extras. AI Builder creditele pot fi achiziționate prin AI Builder suplimente.
Aflați mai multe în AI Builder licențiere.