Deli z drugimi prek


Pogosta vprašanja za obdelavo dokumentov

Ta članek vsebuje pogosta vprašanja o modelu obdelave dokumentov v AI Builder. Če tukaj ne najdete svojega vprašanja, si oglejte Pregled modela AI za obdelavo dokumentov ali pošljite svoje vprašanje Power Automate Skupnosti za AI Builder.

Funkcionalnost

Kaj lahko storim z obdelavo dokumentov?

Z obdelavo dokumentov lahko zgradite model AI po meri za pridobivanje informacij iz različnih vrst dokumentov.

  • Možnost Dokumenti s fiksno predlogo je idealna, če je elemente vaših dokumentov mogoče najti na podobnih mestih. Običajno velja za račune, naročilnice, dobavnice in davčne obrazce.
  • Možnost splošnih dokumentov je idealna za vse vrste dokumentov, vključno s tistimi, ki jih podpira prva možnost, pa tudi za pogodbe, izjave o delu, pisma in druge. Ta možnost je lahko močnejša za pridobivanje podatkov, vendar zahteva daljši čas usposabljanja.

Več o tem v Pregledu modela obdelave dokumentov.

Katere vrste dokumentov lahko obravnava obdelava dokumentov?

Podprte vrste datotek so PDF, JPG in PNG.

Katere podatke lahko pridobim iz dokumentov z uporabo obdelave dokumentov?

Obdelava dokumentov lahko ekstrahira polja, tabele in potrditvena polja iz dokumentov.

Več o tem v Določite podatke za ekstrahiranje.

Ali lahko iz dokumentov izvlečem ročno napisano besedilo?

Da. Obdelava dokumentov lahko iz vaših dokumentov izloči natisnjeno in ročno napisano besedilo.

Koliko vzorcev potrebujem za usposabljanje modela obdelave dokumentov?

Za visokokakovostne dokumente, ki uporabljajo enako postavitev, bi moralo zadostovati pet vzorčnih dokumentov. Za dokumente nizke kakovosti (na primer skeniranje slabe kakovosti) bo morda potrebnih več vzorčnih dokumentov. Za izboljšanje rezultatov uporabite 15 do 20 vzorčnih dokumentov.

Najboljši postopki

  • Za predloge dokumentov

    • Ena (1) postavitev na zbirko.
    • Postavitev mora biti enaka znotraj iste zbirke.
    • Najmanj pet (5) in največ 20 dokumentov na zbirko (ne prekoračite te omejitve).
  • Za splošne dokumente

    • Ustvarite en sam model za vse različice vrste dokumenta, vključno s strukturiranimi in nestrukturiranimi dokumenti.

    • Označite polja, ki ustrezajo njihovim vrednostim, za boljšo natančnost ekstrakcije.

      Za ID dobavitelja na primer uporabite »supplier_id«. Imena polj se morajo ujemati z jezikom dokumenta.

    • Najmanj pet (5) in največ 20 dokumentov na zbirko (ne prekoračite te omejitve).

Moj model je trenutno objavljen v v3.1 (GA) in nameravam ga znova usposobiti z uporabo v4.0 (GA). Ali je treba ponovno označiti vse moje dokumente?

Razen če v zbirko dodajate nova polja, potrditvena polja, tabele, podpise za ekstrakcijo podatkov ali nove dokumente, vam ni treba znova označiti vseh dokumentov.

Pred objavo modela priporočamo, da model hitro preskusite z enim ali več vzorci, da preverite in zagotovite, da so vsa želena polja pravilno ekstrahirana.

Ali lahko preklopim z ene vrste dokumenta na drugo?

Da, pri urejanju modela lahko preklapljate med tipom dokumenta s fiksno predlogo in tipom splošnega dokumenta. Vendar to stikalo ni podprto za račune.

Ali lahko en sam model obdelave obrazca izvleče informacije iz dokumentov, ki imajo različne postavitve ali predloge?

Da. Z uporabo funkcije zbirk usposobite en model za obdelavo obrazcev za obdelavo dokumentov, ki imajo različne postavitve.

Več o tem v Združevanje dokumentov po zbirkah.

Ali lahko obdelava dokumentov obravnava več obrazcev v enem dokumentu?

Vsak obrazec mora biti v ločeni datoteki. Če imate na primer dokument PDF z več računi, ustvarite ločeno datoteko za vsak račun, preden ga pošljete modelu za obdelavo dokumentov.

Določite lahko tudi strani za model obdelave dokumentov, ki jih želite obravnavati. Na ta način lahko izkoristite funkcionalnost modela za kroženje strani za stranjo in obdelavo enega obrazca naenkrat.

Več o tem v Obseg strani.

Izučil sem model obdelave dokumentov, vendar ne dosegam dobrih rezultatov, ko gre za ekstrahirane podatke. Kako lahko izboljšam model?

Če vaš model vrača slabe rezultate po tem, ko ste ga usposobili, uredite model in zagotovite več vzorcev za usposabljanje. Več vzorcev kot zagotovite, bolj se model AI nauči izvleči podatke iz vaših dokumentov.

Več o tem v Izboljšajte učinkovitost vašega modela obdelave dokumentov.

Omejitve

Kakšno je največje število dokumentov, ki jih lahko obdelam?

Vsakih 60 sekund lahko obdelate do 360 dokumentov na okolje.

Zakaj so nekateri znaki napačno prepoznani?

  • Lahko se zgodi, da se nekateri znaki zamešajo: 0 (številka) in O (črka), 1 (številka) in l (črka), 4 (številka) in A (črka) itd.
  • Lahko se zgodi, da so nekateri znaki nad drugimi ali blizu njih nepravilno prepoznani: O (črka) nad navpično črto postane 0 (številka), 5 (številka) nad črto postane $ (znak za ameriški dolar), l_ (mala črka, podčrtaj) postane L (velika črka) in več.
  • Lahko se zgodi, da so nekateri znaki na dokumentih slabe kakovosti prepoznani nepravilno ali pa sploh ne.

V prejšnjih primerih ni mogoče storiti ničesar, da bi AI Builder izboljšali prepoznavanje. Priporočamo, da izboljšate kakovost in postavitev izvornega dokumenta za rešitev podobnih težav.

opomba,

Microsoft nenehno izboljšuje tehnologijo optičnega prepoznavanja znakov (OCR) za zaznavanje znakov, zato se takšne težave pojavljajo manj pogosto.

Ali lahko ustvarim model s številnimi zbirkami?

Ustvarite lahko do 200 zbirk na model. Vendar pa usposabljanje Splošni dokumenti modeli z desetinami kolekcij lahko trajajo več ur in – v redkih primerih – časovna omejitev. Če ima vaš model veliko zbirk, pričakujte, da boste na dokončanje usposabljanja modela čakali do 24 ur.

Ali lahko ustvarim model v rešitvi?

Trenutno ni mogoče ustvariti modela v rešitvi.

Ali lahko v svojem modelu obdelave dokumentov uporabljam pogodbe in pisma?

Da, nestrukturirani dokumenti, kot so pogodbe in pisma, so podprti z obdelavo dokumentov z uporabo Splošni dokumenti možnost.

Primerjave

Kakšne so razlike med obdelavo dokumentov, obdelavo računov, obdelavo potrdil, čitalnik osebnih dokumentov, čitalnik vizitk in prepoznavanje besedila?

Glede na vašo situacijo boste morda morali uporabiti določen model ali kombinacijo obeh.

Uporaba prepoznavanje besedila ko želite izvleči celotno besedilo na sliki ali PDF-ju. Nato lahko na primer poiščete ključno besedo v izvlečenem besedilu ali zgradite nekaj fiksnih pravil za ekstrahiranje določenih elementov.

Če želite izvleči podatke iz računov, potrdil, potnih listov, vozniških dovoljenj ali vizitk, začnite z ustreznim vnaprej pripravljenim modelom:

Te vnaprej izdelane modele lahko uporabite takoj, ne da bi morali ustvariti nov model. Ti modeli lahko izvlečejo običajne informacije, ki jih najdete v ustrezni vrsti dokumenta.

Za katero koli drugo vrsto dokumenta lahko ustvarite model obdelave dokumenta po meri, da izvlečete polja in tabele, ki jih potrebujete. To velja tudi, če potrebujete dodatne informacije, ki jih vnaprej pripravljeni model ne ponuja.

Več o tem v Modelu obdelave dokumentov po meri.

Kakšna je razlika med AI Builder obdelavo dokumentov in Azure Form Recognizer?

AI Builder obdelava dokumentov je zgrajena na Azure Form Recognizer. To obema izdelkoma zagotavlja najnovejši napredek Microsoftove umetne inteligence.

  • AI Builder je del Microsoft Power Platform. To vsakomur omogoča dodajanje umetne inteligence v aplikacije in avtomatizacijo z vmesnikom, ki je enostaven za uporabo. Ni vam treba biti razvijalec ali podatkovni znanstvenik.

  • Azure Form Recognizer je namenjen profesionalnim razvijalcem. Uporabijo lahko preproste API-je REST, da svojim rešitvam kode po meri dodajo zmogljivosti AI.

Stroškovne možnosti

Koliko stane AI Builder obdelava dokumentov?

Brezplačno lahko začnete preizkušati obdelavo dokumentov tako, da začnete preskusno različico. Ko ga ocenite, morate kupiti AI Builder kredite za uporabo obdelave dokumentov. Vsaka stran, ki jo obdelate z obdelavo dokumentov, porabi AI Builder kredite, tudi če stran ne vsebuje podatkov za ekstrahiranje. AI Builder kredite je mogoče kupiti prek AI Builder dodatkov.

Več o tem v AI Builder licenciranju.