Deli putem


Najčešća pitanja o obradi dokumenta

Ovaj članak se sastoji od često postavljanih pitanja o modelu obrade dokumenata u AI Builder. Ako ovde ne pronađete svoje pitanje, pregledajte Pregled AI modela za obradu dokumenata ili pošaljite svoje pitanje Zajednici Power Automate za AI Builder.

Funkcionalnost

Šta mogu da uradim sa obradom dokumenata?

Sa obradom dokumenata, možete izgraditi prilagođeni AI model za izdvajanje informacija iz različitih vrsta dokumenata.

  • Opcija Fiksni šablon dokumenata je idealna ako se elementi vaših dokumenata mogu naći na sličnim mestima. To je obično slučaj za fakture, narudžbenice, naloge za isporuku i poreske obrasce.
  • Opcija opštih dokumenata je idealna za bilo koju vrstu dokumenta, uključujući i one koje podržava prva opcija, ali i ugovore, izjavu o radu, pisma i druge. Ova opcija može biti moćnija za izdvajanje podataka, ali zahteva duže vreme obuke.

Saznajte više u Pregled modela obrade dokumenata.

Koje vrste dokumenata mogu obrada dokumenata rukovanje?

Podržani tipovi datoteka su PDF, JPG i PNG.

Koje podatke mogu izvući iz dokumenata pomoću obrade dokumenata?

Obrada dokumenata može izvući polja, tabele i polja za potvrdu iz dokumenata.

Saznajte više u Definišite informacije za izvlačenje.

Mogu li izvući rukom pisani tekst iz dokumenata?

Da. Obrada dokumenata može izvući štampani i rukom pisani tekst iz vaših dokumenata.

Koliko uzoraka mi je potrebno za obuku modela za obradu dokumenata?

Za visokokvalitetne dokumente koji koriste isti izgled, pet uzoraka dokumenata treba da bude dovoljno. Za dokumente niskog kvaliteta (na primer, skeniranje lošeg kvaliteta), možda će biti potrebno više uzoraka dokumenata. Da biste poboljšali rezultate, koristite 15 do 20 uzoraka dokumenata.

Najbolji primeri iz prakse

  • Za šablone dokumenata

    • Jedan (KSNUMKS) raspored po kolekciji.
    • Raspored mora biti identičan u okviru iste kolekcije.
    • Najmanje pet (5) i maksimalno 20 dokumenata po kolekciji (ne prelazite ovu granicu).
  • Za opšte dokumente

    • Kreirajte jedinstveni model za sve varijacije tipa dokumenta, uključujući strukturirane i nestrukturirane dokumente.

    • Označite polja relevantna za njihove vrednosti za bolju tačnost ekstrakcije.

      Na primer, koristite "supplier_id" za ID dobavljača. Imena polja treba da odgovaraju jeziku dokumenta.

    • Najmanje pet (5) i maksimalno 20 dokumenata po kolekciji (ne prelazite ovu granicu).

Moj model je trenutno objavljen u v3.1 (GA), i planiram da ga prekvalifikujem koristeći v4.0 (GA). Da li je potrebno ponovo označiti sve moje dokumente?

Osim ako ne dodajete nova polja, polja za potvrdu, tabele, potpise za ekstrakciju podataka ili nove dokumente u kolekciju, ne morate ponovo označavati sve dokumente.

Pre objavljivanja modela, preporučuje se da brzo testirate svoj model koristeći jedan ili više uzoraka kako biste proverili i osigurali da su sva željena polja pravilno izvađena.

Mogu li da se prebacim sa jednog tipa dokumenta na drugi?

Da, kada uređujete svoj model, možete se prebacivati između fiksnog tipa dokumenta šablona i opšteg tipa dokumenta. Međutim, ovaj prekidač nije podržan za fakture.

Može li jedan model za obradu obrazaca izvući informacije iz dokumenata koji imaju različite izglede ili šablone?

Da. Korišćenjem funkcije kolekcija, trenirate jedan model za obradu obrazaca za rukovanje dokumentima koji imaju različite izglede.

Saznajte više u Grupirajte dokumente po kolekcijama.

Može li obrada dokumenata obraditi više obrazaca u jednom dokumentu ?

Svaki obrazac mora biti u posebnoj datoteci. Na primer, ako imate PDF dokument sa više faktura u njemu, kreirajte zasebnu datoteku za svaku fakturu pre nego što je pošaljete u model za obradu dokumenata.

Takođe možete odrediti stranice za model obrade dokumenata za rukovanje. Na ovaj način možete iskoristiti funkcionalnost modela za petljanje stranicu po stranicu i obradu jednog po jednog obrasca.

Saznajte više u Opseg stranica.

Obučio sam model za obradu dokumenata, ali ne dobijam dobre rezultate kada su u pitanju izdvojeni podaci. Kako mogu da poboljšam model?

Ako vaš model vraća loše rezultate nakon što ste ga trenirali, uredite model i obezbedite više uzoraka za obuku. Što više uzoraka pružite, to više AI model uči kako da izvuče podatke iz vaših dokumenata.

Saznajte više u Poboljšajte performanse vašeg modela za obradu dokumenata.

Ograničenja

Koji je maksimalan broj dokumenata koje mogu da obradim?

Možete obraditi do 360 dokumenata po okruženju, svakih 60 sekundi.

Zašto se neki likovi pogrešno prepoznaju?

  • Može se desiti da se neki znakovi zbune: 0 (broj) i O (slovo), 1 (broj) i l (slovo), 4 (broj) i A (slovo) i još mnogo toga.
  • Može se desiti da se neki znakovi iznad ili blizu drugima pogrešno prepoznaju: O (slovo) preko vertikalne linije postaje 0 (broj), 5 (broj) preko linije postaje $ (znak američkog dolara), l_ (malo slovo, podvlaka) postaje L (veliko slovo) i još mnogo toga.
  • Može se desiti da se neki znakovi na dokumentima lošeg kvaliteta pogrešno prepoznaju ili uopšte ne prepoznaju.

U prethodnim slučajevima, ništa se ne može uraditi da AI Builder se poboljša prepoznavanje. Preporučujemo da poboljšamo kvalitet i izgled izvornog dokumenta kako bismo rešili slične probleme.

Belešku

Microsoft stalno poboljšava tehnologiju optičkog prepoznavanja znakova (OCR) za otkrivanje znakova, tako da se takvi problemi dešavaju ređe.

Mogu li da napravim model sa mnogo kolekcija?

Možete kreirati do 200 kolekcija po modelu. Međutim, obuka modela opštih dokumenata sa desetinama kolekcija može potrajati nekoliko sati i - u retkim prilikama - tajm. Ako vaš model ima veliki broj kolekcija, očekujte da sačekate do 24 sata za završetak obuke modela.

Mogu li da napravim model u rešenju?

Trenutno nije moguće kreirati model u rešenju.

Mogu li da koristim ugovore i pisma u svom modelu za obradu dokumenata?

Da, nestrukturirani dokumenti kao što su ugovori i pisma podržani su obradom dokumenata, koristeći opciju Opšti dokumenti .

Poređenja

Koje su razlike između obrade dokumenata, obrade faktura, obrade računa, čitača ličnih dokumenata, čitača vizit kartica i prepoznavanja teksta?

U zavisnosti od vaše situacije, možda ćete morati da koristite određeni model ili njihovu kombinaciju.

Koristite prepoznavanje teksta kada želite da izvučete sav tekst prisutan na slici ili PDF-u. Tada možete, na primer, potražiti ključnu reč u tekstu koji se izvlači ili izgraditi neka fiksna pravila za izdvajanje određenih stavki.

Ako želite da izvučete informacije iz faktura, potvrda, pasoša, vozačkih dozvola ili vizit kartica, počnite sa odgovarajućim unapred izgrađenim modelom:

Možete odmah koristiti ove unapred izgrađene modele, bez potrebe za kreiranjem novog modela. Ovi modeli mogu izvući zajedničke informacije koje se nalaze u odgovarajućem tipu dokumenta.

Za bilo koji drugi tip dokumenta, možete kreirati prilagođeni model za obradu dokumenata da biste izvukli polja i tabele koje su vam potrebne. Ovo važi i ako su vam potrebne dodatne informacije koje ne pruža unapred izgrađen model.

Saznajte više u Prilagođeni model obrade dokumenata.

Koja je razlika između AI Builder obrade dokumenata i Azure Form Recognizer?

AI Builder obrada dokumenata je izgrađena na vrhu Azure Form Recognizer-a. Ovo obezbeđuje oba proizvoda sa najnovijim dostignućima u Microsoft AI.

  • AI Builder je deo Microsoft Power Platform. Ovo omogućava svakome da doda AI u aplikacije i automatizaciju sa interfejsom koji je jednostavan za korišćenje. Ne morate biti programer ili naučnik podataka.

  • Azure Form Recognizer je namenjen profesionalnim programerima. Oni mogu da koriste jednostavne REST API-je da dodaju AI mogućnosti svojim prilagođenim kodnim rješenjima.

Opcije troškova

Koliko AI Builder košta obrada dokumenata?

Možete početi da isprobavate obradu dokumenata besplatno pokretanjem probnog perioda. Nakon što ga procenite, potrebno je da kupite AI Builder kredite da biste koristili obradu dokumenata. Svaka stranica koju obrađujete obradom dokumenata troši AI Builder kredite, čak i ako stranica ne sadrži podatke za izvlačenje. AI Builder Krediti se mogu kupiti putem AI Builder dodataka.

Saznajte više u AI Builder licenciranju.