Întrebări frecvente despre procesarea documentelor
Acest articol conține întrebări frecvente despre modelul de procesare a documentelor din AI Builder. Dacă nu găsiți întrebarea dvs. aici, consultați prezentarea generală a modelului AI de procesare a documentelor sau trimiteți întrebarea Power Automate dvs. comunității pentru AI Builder.
Cu procesarea documentelor, puteți construi un model AI personalizat pentru a extrage informații din diferite tipuri de documente.
- Opțiunea Documente cu șablon fix este ideală dacă elementele documentelor dvs. pot fi găsite în locuri similare. Este de obicei cazul facturilor, comenzilor de cumpărare, comenzilor de livrare și formularelor fiscale.
- Optiunea Documente generale este ideala pentru orice tip de document, inclusiv cele sustinute de prima optiune dar si contracte, declaratii de munca, scrisori si altele. Această opțiune poate fi mai puternică pentru extragerea datelor, dar necesită un timp de antrenament mai lung.
Aflați mai multe: Prezentare generală a modelului de procesare a documentelor
Tipurile de fișiere acceptate sunt PDF, JPG și PNG.
Procesarea documentelor poate extrage câmpuri, tabele și casete de selectare din documente.
Aflați mai multe: Definiți informațiile de extras
Da. Procesarea documentelor poate extrage text tipărit și scris de mână din documentele dvs.
Pentru documentele de înaltă calitate care utilizează același format, ar trebui să fie suficiente cinci modele de documente. Pentru documentele de calitate scăzută (de exemplu, scanări de calitate slabă, ar putea fi necesare mai multe documente eșantion. Pentru a îmbunătăți rezultatele, utilizați 15 până la 20 de documente eșantion.
Poate un singur model de procesare a formularelor să extragă informații din documente care au machete sau șabloane diferite?
Da. Utilizând caracteristica colecții, instruiți un singur model de procesare a formularelor pentru a gestiona documente care au aspecte diferite.
Aflați mai multe: Gruparea documentelor după colecții
Fiecare formular trebuie să fie într-un fișier separat. De exemplu, dacă aveți un document PDF cu mai multe facturi, creați un fișier separat pentru fiecare factură înainte de a o trimite la modelul de procesare a documentelor.
De asemenea, puteți specifica pagini pe care să le gestioneze modelul de procesare a documentelor. În acest fel, puteți profita de funcționalitatea modelului pentru a bucla pagină cu pagină și pentru a procesa un formular la un moment dat.
Aflați mai multe:Interval de pagini
Am instruit un model de procesare a documentelor, dar nu obțin rezultate bune atunci când vine vorba de datele extrase. Cum pot îmbunătăți modelul?
Dacă modelul dvs. returnează rezultate slabe după ce l-ați antrenat, editați modelul și furnizați mai multe eșantioane pentru instruire. Cu cât furnizați mai multe mostre, cu atât modelul AI învață mai mult cum să extragă date din documentele dvs.
Aflați mai multe: Îmbunătățiți performanța modelului de procesare a documentelor
Puteți procesa până la 360 de documente per mediu, la fiecare 60 de secunde.
- Se poate întâmpla ca unele caractere să se confunde: 0 (număr) și O (literă), 1 (număr) și l (literă), 4 (număr) și A (literă) și multe altele.
- Se poate întâmpla ca unele caractere peste sau aproape de altele să fie recunoscute incorect: O (literă) peste o linie verticală devine 0 (număr), 5 (număr) peste o linie devine $ (semnul dolarului american), l_ (literă mică, subliniere) devine L (literă mare) și multe altele.
- Se poate întâmpla ca unele caractere din documente de calitate slabă să fie recunoscute incorect sau deloc.
În cazurile de mai sus, nu se poate face nimic pentru AI Builder a îmbunătăți recunoașterea. Vă recomandăm să îmbunătățiți calitatea și aspectul documentului sursă pentru a rezolva probleme similare.
Notă
Tehnologia OCR pentru detectarea caracterelor este îmbunătățită constant de Microsoft, astfel încât astfel de probleme se întâmplă mai rar.
Puteți crea până la 200 de colecții per model. Cu toate acestea, instruirea modelelor de documente generale cu zeci de colecții poate dura câteva ore și, în cazuri rare, o pauză. Dacă modelul dvs. are un număr mare de colecții, așteptați-vă să așteptați până la 24 de ore pentru finalizarea instruirii modelului.
În prezent, nu este posibil să creați un model într-o soluție.
Da, documentele nestructurate, cum ar fi contractele și scrisorile, sunt acceptate prin procesarea documentelor, utilizând opțiunea Documente generale.
Care sunt diferențele dintre procesarea documentelor, procesarea facturilor, procesarea chitanțelor, cititorul de documente de identitate, cititorul de cărți de vizită și recunoașterea textului?
În funcție de situația dvs., poate fi necesar să utilizați un anumit model sau o combinație a acestora.
Utilizați recunoașterea textului când doriți să extrageți tot textul prezent într-o imagine sau într-un PDF. Apoi, puteți, de exemplu, să căutați un cuvânt cheie în textul extras sau să construiți câteva reguli fixe pentru a extrage anumite elemente.
Dacă doriți să extrageți informații din facturi, chitanțe, pașapoarte, permise de conducere sau cărți de vizită, începeți cu modelul predefinit corespunzător:
- Procesarea facturilor
- Procesarea chitanțelor
- Cititor de documente de identitate (pașapoarte și permise de conducere)
- Cititor de cărți de vizită
Puteți utiliza aceste modele predefinite imediat, fără a fi nevoie să creați un model nou. Aceste modele pot extrage informații comune găsite în tipul de document corespunzător.
Pentru orice alt tip de document, puteți crea un model personalizat de procesare a documentelor pentru a extrage câmpurile și tabelele de care aveți nevoie. Acest lucru este valabil și dacă aveți nevoie de informații suplimentare care nu sunt furnizate de modelul predefinit.
Aflați mai multe: Model personalizat de procesare a documentelor
AI Builder procesarea documentelor este construită pe baza Azure Form Recognizer. Acest lucru oferă ambelor produse cele mai recente progrese în Microsoft AI.
AI Builder face parte din Microsoft Power Platform. Acest lucru permite oricui să adauge AI în aplicații și automatizare cu o interfață ușor de utilizat. Nu trebuie să fiți dezvoltator sau expert în date.
Azure Form Recognizer se adresează dezvoltatorilor profesioniști. Ei pot utiliza API-uri REST simple pentru a adăuga capabilități AI la soluțiile lor de cod personalizate.
Puteți începe să încercați procesarea documentelor gratuit începând o perioadă de încercare. După ce îl evaluați, trebuie să achiziționați AI Builder credite pentru a utiliza procesarea documentelor. Fiecare pagină pe care o procesați cu procesarea documentelor consumă AI Builder credite, chiar dacă pagina nu conține date de extras. AI Builder Creditele pot fi achiziționate prin AI Builder suplimente.
Aflați mai multe: AI Builder licențiere