Zdieľať cez


Najčastejšie otázky týkajúce sa spracovania dokumentov

Tento článok obsahuje často kladené otázky o modeli spracovania dokumentov v AI Builder. Ak tu svoju otázku nenájdete, prečítajte si Prehľad modelu umelej inteligencie na spracovanie dokumentov alebo odošlite svoju otázku do Power Automate Komunity pre AI Builder.

Funkcie

Čo môžem robiť so spracovaním dokumentov?

Pomocou spracovania dokumentov si môžete vytvoriť vlastný model AI na extrahovanie informácií z rôznych druhov dokumentov.

  • Možnosť Dokumenty s pevnou šablónou je ideálna, ak prvky vašich dokumentov možno nájsť na podobných miestach. Zvyčajne je to prípad faktúr, nákupných objednávok, dodacích objednávok a daňových formulárov.
  • Voľba Všeobecné dokumenty je ideálna pre akýkoľvek druh dokumentov, vrátane tých, ktoré podporuje prvá možnosť, ale aj zmlúv, výkazov práce, listov a iných. Táto možnosť môže byť výkonnejšia na extrakciu údajov, ale vyžaduje dlhší čas na zaškolenie.

Viac sa dozviete v Prehľad modelu spracovania dokumentov.

Aké typy dokumentov dokáže spracovanie dokumentov spracovávať?

Podporované sú typy súborov PDF, JPG a PNG.

Aké údaje môžem získať z dokumentov pomocou spracovania dokumentov?

Spracovanie dokumentov môže extrahovať polia, tabuľky a začiarkavacie políčka z dokumentov.

Ďalšie informácie nájdete v časti Definovanie informácií na extrahovanie.

Môžem z dokumentov extrahovať ručne písaný text?

Áno. Spracovanie dokumentov dokáže z vašich dokumentov extrahovať tlačený a ručne písaný text.

Koľko vzoriek potrebujem na trénovanie modelu spracovania dokumentov?

Na vysokokvalitné dokumenty, ktoré používajú rovnaké rozloženie, by malo stačiť päť vzorových dokumentov. Pre dokumenty nízkej kvality (napríklad skeny nízkej kvality) môže byť potrebných viac vzorových dokumentov. Na zlepšenie výsledkov použite 15 až 20 vzorových dokumentov.

Osvedčené postupy

  • Pre šablónové dokumenty

    • Jedno (1) rozloženie na kolekciu.
    • Rozloženie musí byť rovnaké v rámci tej istej kolekcie.
    • Minimálne päť (5) a maximálne 20 dokumentov na kolekciu (tento limit neprekračujte).
  • Pre všeobecné dokumenty

    • Vytvorte jeden model pre všetky variácie typu dokumentu vrátane štruktúrovaných aj neštruktúrovaných dokumentov.

    • Označte polia relevantné pre ich hodnoty pre lepšiu presnosť extrakcie.

      Napríklad pre ID dodávateľa použite "supplier_id". Názvy polí by sa mali zhodovať s jazykom dokumentu.

    • Minimálne päť (5) a maximálne 20 dokumentov na kolekciu (tento limit neprekračujte).

Môj model je momentálne publikovaný vo verzii 3.1 (GA) a plánujem ho preškoliť na verziu 4.0 (GA). Je potrebné znovu označiť všetky moje dokumenty?

Ak do kolekcie nepridávate nové polia, začiarkavacie políčka, tabuľky, podpisy na extrakciu údajov alebo nové dokumenty, nemusíte znova označovať všetky dokumenty.

Pred publikovaním modelu sa odporúča rýchlo otestovať model pomocou jednej alebo viacerých ukážok, aby ste overili a zabezpečili, že všetky požadované polia sú správne extrahované.

Môžem prejsť z jedného typu dokumentu na druhý?

Áno, pri úprave modelu môžete prepínať medzi pevným typom dokumentu šablóny a všeobecným typom dokumentu. Tento prepínač však nie je podporovaný pre faktúry.

Môže jeden model spracovania formulárov extrahovať informácie z dokumentov, ktoré majú odlišné rozloženie alebo šablóny?

Áno. Použitím funkcie kolekcií trénujete jeden model spracovania formulárov na spracovanie dokumentov s rôznym rozložením.

Ďalšie informácie nájdete v časti Zoskupovať dokumenty podľa kolekcií.

Dokáže spracovanie dokumentov spracovať viacero formulárov v jedinom dokumente?

Každý formulár musí byť v samostatnom súbore. Ak máte napríklad dokument PDF s viacerými faktúrami, pred odoslaním do modelu spracovania dokumentov vytvorte pre každú faktúru samostatný súbor.

Môžete tiež určiť strany, ktoré má model spracovania dokumentu spracovať. Takýmto spôsobom môžete využiť výhody funkcií modelu na opakovanie stránky po stránke a spracovanie jedného formulára naraz.

Viac informácií nájdete v časti Rozsah strán.

Trénoval som model spracovania dokumentov, ale pokiaľ ide o extrahované údaje, nedosahujem dobré výsledky. Ako môžem model vylepšiť?

Ak váš model po natrénovaní vracia zlé výsledky, upravte model a poskytnite viac vzoriek na tréning. Čím viac vzoriek poskytnete, tým viac sa model AI naučí extrahovať údaje z vašich dokumentov.

Ďalšie informácie nájdete v časti Zlepšenie výkonu modelu spracovania dokumentov.

Obmedzenia

Aký je maximálny počet dokumentov, ktoré môžem spracovať?

Môžete spracovať až 360 dokumentov na prostredie, každých 60 sekúnd.

Prečo sa niektoré znaky rozpoznajú nesprávne?

  • Môže sa stať, že sa niektoré znaky pomýlia: 0 (číslo) a O (písmeno), 1 (číslo) a l (písmeno), 4 (číslo) a A (písmeno) a ďalšie.
  • Môže sa stať, že niektoré znaky nad alebo blízko iných sa rozpoznajú nesprávne: O (písmeno) nad zvislou čiarou sa zmení na 0 (číslo), 5 (číslo) nad riadkom sa zmení na $ (znak amerického dolára), l_ (malé písmeno, podčiarknutie) sa zmení na L (veľké písmeno) a ďalšie.
  • Môže sa stať, že niektoré znaky na dokumentoch nízkej kvality sa rozpoznajú nesprávne alebo vôbec.

V predchádzajúcich prípadoch nie je možné v AI Builder vylepšiť rozpoznávanie. Na vyriešenie podobných problémov odporúčame zlepšiť kvalitu a rozloženie zdrojového dokumentu.

Poznámka

Spoločnosť Microsoft neustále vylepšuje technológiu optického rozpoznávania znakov (OCR) na zisťovanie znakov, takže takéto problémy sa vyskytujú menej často.

Môžem vytvoriť model s mnohými kolekciami?

Na jeden model môžete vytvoriť až 200 kolekcií. Školenie modelov Všeobecných dokumentov s desiatkami kolekcií však môže trvať niekoľko hodín a v zriedkavých prípadoch môže uplynúť časový limit. Ak má váš model vysoký počet zbierok, počkajte až 24 hodín na dokončenie modelového školenia.

Môžem vytvoriť model v riešení?

V súčasnosti nie je možné vytvoriť model v riešení.

Môžem použiť zmluvy a listy vo svojom modeli spracovania dokumentov?

Áno, neštruktúrované dokumenty, ako sú zmluvy a listy, sú podporované spracovaním dokumentov pomocou možnosti Všeobecné dokumenty .

Porovnania

Aké sú rozdiely medzi spracovaním dokumentov, spracovaním faktúr, spracovaním účteniek, čítačkou dokladov totožnosti, čítačkou vizitiek a rozpoznávaním textu?

V závislosti od vašej situácie bude možno potrebné použiť konkrétny model alebo ich kombináciu.

Použite rozpoznávanie textu keď chcete extrahovať všetok text prítomný v obrázku alebo PDF. Potom môžete napríklad vyhľadať kľúčové slovo v extrahovanom texte alebo vytvoriť určité pevné pravidlá na extrahovanie určitých položiek.

Ak chcete extrahovať informácie z faktúr, potvrdení, cestovných pasov, vodičských preukazov alebo vizitiek, začnite zodpovedajúcim vopred zostaveným modelom:

Tieto vopred pripravené modely môžete použiť okamžite, bez toho, aby ste museli vytvárať nový model. Tieto modely môžu extrahovať bežné informácie, ktoré našli v zodpovedajúcom type dokumentu.

Pre akýkoľvek iný typ dokumentu môžete vytvoriť vlastný model spracovania dokumentov na extrahovanie polí a tabuliek, ktoré potrebujete. To platí aj vtedy, ak potrebujete dodatočné informácie, ktoré nie sú súčasťou vopred pripraveného modelu.

Viac informácií nájdete v Vlastný model spracovania dokumentov.

Aký je rozdiel medzi AI Builder spracovaním dokumentov a Azure Form Recognizer?

AI Builder Spracovanie dokumentov je postavené na Azure Form Recognizer. To poskytuje obom produktom najnovší pokrok v oblasti Microsoft AI.

  • AI Builder je súčasťou Microsoft Power Platform. To umožňuje komukoľvek pridať AI do aplikácií a automatizovať pomocou ľahko použiteľného rozhrania. Nemusíte byť vývojár alebo dátový vedec.

  • Azure Form Recognizer je zameraný na profesionálnych vývojárov. Môžu používať jednoduché rozhrania REST API na pridanie funkcií AI do riešení s vlastným kódom.

Cenové možnosti

Koľko stojí AI Builder spracovanie dokumentov?

Spracovanie dokumentov si môžete bezplatne vyskúšať spustením skúšobnej verzie. Keď ho vyhodnotíte, musíte si zakúpiť AI Builder kredity, aby ste mohli používať spracovanie dokumentov. Každá stránka, ktorú spracovávate pri spracovaní dokumentov, spotrebuje AI Builder kredity, aj keď stránka neobsahuje údaje na extrahovanie. AI Builder kredity je možné zakúpiť prostredníctvom AI Builder doplnkov.

Viac informácií nájdete v AI Builder licencovaní.