Loe inglise keeles

Jagamisviis:


Dokumenditöötluse KKK

See artikkel koosneb korduma kippuvatest küsimustest dokumenditöötlusmudeli kohta AI Builder. Kui te ei leia siit oma küsimust, vaadake üle tehisintellekti mudeli töötlemise dokumendi ülevaade või esitage oma küsimus kogukonnale Power Automate AI Builder.

Funktsionaalsus

Mida saab dokumenditöötlusega teha?

Dokumenditöötluse abil saate luua kohandatud tehisintellekti mudeli teabe eraldamiseks erinevat tüüpi dokumentidest.

  • Suvand Fikseeritud malliga dokumendid on ideaalne, kui teie dokumentide elemendid on leitud sarnastest kohtadest. Tavaliselt on see nii arvete, ostutellimuste, tarnetellimuste ja maksuvormide puhul.
  • Ülddokumentide valik sobib ideaalselt igasuguste dokumentide jaoks, sealhulgas nende jaoks, mida toetab esimene võimalus, aga ka lepingud, tööaruanded, kirjad ja muud. See suvand võib olla andmete ekstraktimiseks võimsam, kuid nõuab pikemat treeningaega.

Lisateave: Dokumenditöötlusmudeli ülevaade

Milliseid dokumente saab dokumenditöötlusega töödelda?

Toetatud failitüübid on PDF, JPG ja PNG.

Milliseid andmeid saab dokumentidest dokumenditöötluse abil ekstraktida?

Dokumenditöötlusega saab dokumentidest eraldada välju, tabeleid ja märkeruute.

Lisateave: Ekstraktitava teabe määratlemine

Kas ma saan dokumentidest käsitsi kirjutatud teksti ekstraktida?

Jah. Dokumenditöötlus võib eraldada teie dokumentidest prinditud ja käsitsi kirjutatud teksti.

Mitu näidist on vaja dokumenditöötlusmudeli koolitamiseks?

Kvaliteetsete dokumentide puhul, mis kasutavad sama paigutust, peaks piisama viiest näidisdokumendist. Madala kvaliteediga dokumentide puhul (nt halva kvaliteediga skannimine) võib vaja minna rohkem näidisdokumente. Tulemuste parandamiseks kasutage 15–20 näidisdokumenti.

Kas üks vormitöötlusmudel saab eraldada teavet erineva paigutuse või malliga dokumentidest?

Jah. Kogude funktsiooni abil saate treenida ühte vormitöötlusmudelit, et käsitleda erineva paigutusega dokumente.

Lisateave: dokumentide rühmitamine kogude järgi

Kas dokumenditöötlus saab ühes dokumendis käsitleda mitut vormi ?

Iga vorm peab olema eraldi failis. Näiteks kui teil on PDF-dokument, milles on mitu arvet, looge iga arve jaoks eraldi fail, enne kui saadate selle dokumenditöötlusmudelisse.

Samuti saate määrata dokumenditöötlusmudeli käsitletavad leheküljed. Nii saate mudeli funktsioone ära kasutada, et aheldada lehekülgi lehtede kaupa ja töödelda ühte vormi korraga.

Lisateave: Leheküljevahemik

Koolitasin dokumenditöötlusmudelit, kuid ma ei saa väljavõtte andmete osas häid tulemusi. Kuidas ma saan mudelit parandada?

Kui teie mudel annab pärast treenimist halbu tulemusi, muutke mudelit ja andke treenimiseks rohkem näidiseid. Mida rohkem näidiseid esitate, seda rohkem õpib tehisintellekti mudel, kuidas dokumentidest andmeid ekstraktida.

Lisateave: Dokumenditöötlusmudeli jõudluse parandamine

Piirangud

Kui palju dokumente saan töödelda?

Saate töödelda kuni 360 dokumenti keskkonna kohta iga 60 sekundi järel.

Miks tuvastatakse mõned tähemärgid valesti?

  • Võib juhtuda, et mõned tähemärgid lähevad segadusse: 0 (number) ja O (täht), 1 (number) ja l (täht), 4 (number) ja A (täht) ja palju muud.
  • Võib juhtuda, et mõned tähemärgid, mis ületavad teist tähemärki või on teiste tähemärkide lähedal, tuvastatakse valesti: vertikaaljoont ületav O (täht) muutub 0-ks (number), joont ületav 5 (number) muutub $-ks (Ameerika Ühendriikide dollari märk), l_ (väiketäht, alakriips) muutub L-ks (suurtäht) ja palju muud.
  • Võib juhtuda, et mõned halva kvaliteediga dokumentide tähemärgid tuvastatakse valesti või üldse mitte.

Ülaltoodud juhtudel ei saa tunnustamise parandamiseks midagi teha AI Builder . Sarnaste probleemide lahendamiseks soovitame parandada alusdokumendi kvaliteeti ja kujundust.

Märkus

Microsoft täiustab pidevalt OCR-tehnoloogiat märkide tuvastamiseks, nii et selliseid probleeme juhtub harvemini.

Kas ma saan luua paljude kollektsioonidega mudeli?

Ühe mudeli kohta saate luua kuni 200 kollektsiooni. Kuid koolitus Ülddokumentide mudelid kümnete kogudega võivad võtta mitu tundi ja harvadel juhtudel ka aja maha. Kui teie modellil on palju kollektsioone, oodake mudelikoolituse läbimist kuni 24 tundi.

Kas ma saan lahenduses mudeli luua?

Praegu pole lahenduses võimalik mudelit luua.

Kas ma saan dokumentide töötlemise mudelis kasutada lepinguid ja kirju?

Jah, struktureerimata dokumente, nagu lepingud ja kirjad, toetab dokumenditöötlus, kasutades suvandit Ülddokumendid .

Võrdlusi

Mis on dokumenditöötlusel, arvete töötlemisel, kviitungite töötlemisel, isikut tõendava dokumendi lugejal, visiitkaardilugejal ja tekstituvastusel?

Sõltuvalt teie olukorrast peate võib-olla kasutama konkreetset mudelit või nende kombinatsiooni.

Kasutage tekstituvastust , kui soovite ekstraktida kogu pildil või PDF-is oleva teksti. Seejärel saate näiteks ekstraktitud tekstist märksõna otsida või luua teatud üksuste ekstraktimiseks mõned kindlad reeglid.

Kui soovite saada teavet arvetest, kviitungitest, passidest, juhilubadest või visiitkaartidest, alustage vastavast valmismudelist:

Neid valmismudeleid saate kasutada kohe, ilma et peaksite uut mudelit looma. Nende mudelitega saab ekstraktida vastavas dokumenditüübis leiduvat üldist teavet.

Mis tahes muu dokumenditüübi puhul saate luua kohandatud dokumenditöötlusmudeli vajalike väljade ja tabelite ekstraktimiseks. See kehtib ka siis, kui vajate lisateavet, mida eelvalmistatud mudel ei paku.

Lisateave: Kohandatud dokumenditöötlusmudel

Mis on dokumenditöötlusel AI Builder ja Azure’i vormituvastajal?

AI Builder dokumenditöötlus on üles ehitatud Azure’i vormituvastaja peale. See pakub mõlemale tootele Microsofti tehisintellekti uusimaid edusamme.

  • AI Builder on osa Microsoft Power Platform. See võimaldab kõigil lisada tehisintellekti rakendustesse ja automatiseerimisse hõlpsasti kasutatava liidese abil. Te ei pea olema arendaja ega andmeteadlane.

  • Azure’i vormituvastus on suunatud professionaalsetele arendajatele. Nad saavad kasutada lihtsaid REST API-sid, et lisada tehisintellekti võimalusi oma kohandatud koodilahendustele.

Kulude valikud

Kui palju AI Builder maksab dokumentide töötlemine?

Saate alustada dokumenditöötluse tasuta proovimist, alustades prooviversiooni . Pärast selle hindamist peate dokumenditöötluse kasutamiseks ostma AI Builder krediiti. Iga lehekülg, mida dokumenditöötluses töötlete, kulutab AI Builder krediiti, isegi kui leht ei sisalda ekstraktitavaid andmeid. AI Builder Krediiti saab osta lisandmoodulite kaudu AI Builder .

Lisateave: AI Builder litsentsimine