Poznámka
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Tento článek obsahuje odpovědi na časté otázky týkající se modelu zpracování dokumentů v aplikaci AI Builder. Pokud zde nenajdete svůj dotaz, přečtěte si přehled modelu AI pro zpracování dokumentů nebo zašlete svůj dotaz do komunity Power Automate pro AI Builder.
Funkce
Jaké možnosti nabízí zpracování dokumentů?
Pomocí zpracování dokumentů můžete vytvořit vlastní model AI pro extrakci informací z různých druhů dokumentů.
- Možnost Dokumenty s pevnou šablonou je ideální, pokud lze prvky vašich dokumentů nalézt na podobných místech. Obvykle je to případ faktur, nákupních objednávek, dodacích objednávek a daňových formulářů.
- Možnost Obecné dokumenty je ideální pro jakýkoli druh dokumentů, včetně těch, které podporuje první možnost, ale také smlouvy, výkazy práce, dopisy a další. Tato možnost může být výkonnější pro extrakci dat, ale vyžaduje delší dobu školení.
Další informace najdete v tématu Přehled modelu pro zpracování dokumentů.
Jaké typy dokumentů může zpracování dokumentů zpracovat?
Podporované typy souborů jsou PDF, JPG a PNG.
Jaká data mohu získat z dokumentů pomocí zpracování dokumentů?
Zpracování dokumentů může extrahovat pole, tabulky a zaškrtávací políčka z dokumentů.
Další informace najdete v tématu Definujte informace, které chcete extrahovat.
Mohu z dokumentů extrahovat ručně psaný text?
Ano. Zpracování dokumentů může z vašich dokumentů extrahovat tištěný a ručně psaný text.
Kolik vzorků potřebuji k trénování modelu zpracování dokumentů?
U vysoce kvalitních dokumentů se stejným rozložením by mělo stačit pět ukázkových dokumentů. U dokumentů nízké kvality (například špatně naskenovaných dokumentů) může být zapotřebí více vzorových dokumentů. Ke zlepšení výsledků použijte 15 až 20 vzorových dokumentů.
Osvědčené postupy
Šablony dokumentů
- Jedno (1) rozvržení na souboru dokumentů.
- Rozložení musí být identické v rámci stejného souboru dokumentů.
- Minimálně pět (5) a maximálně 20 dokumentů na kolekci (nepřekračujte tento limit).
Obecné dokumenty
Vytvořte jeden model pro všechny varianty typu dokumentu, včetně strukturovaných i nestrukturovaných dokumentů.
Označte pole odpovídající jejich hodnotám pro lepší přesnost extrakce.
Například použijte "supplier_id" pro ID dodavatele. Názvy polí se musí shodovat s jazykem dokumentu.
Minimálně pět (5) a maximálně 20 dokumentů na kolekci (nepřekračujte tento limit).
Můj model je aktuálně publikovaný ve verzi 3.1 (GA) a plánuji ho přetrénovat pomocí verze 4.0 (GA). Je nutné přetagovat všechny mé dokumenty?
Pokud do kolekce nepřidáváte nová pole, zaškrtávací políčka, tabulky, podpisy pro extrakci dat nebo nové dokumenty, nemusíte všechny dokumenty znovu označovat.
Mohu přejít z jednoho typu dokumentu na jiný?
Ano, při úpravách modelu můžete přepínat mezi pevným typem dokumentu šablony a obecným typem dokumentu. Tento přepínač se ale nepodporuje pro faktury.
Může jeden model zpracování formulářů extrahovat informace z dokumentů, které mají různá rozložení nebo šablony?
Ano. Pomocí funkce kolekcí trénujete jeden model zpracování formulářů pro zpracování dokumentů s různým rozložením.
Další informace najdete v tématu Dokumenty skupiny podle kolekcí.
Zvládne zpracování dokumentů více formulářů v jednom dokumentu?
Každý formulář musí být v samostatném souboru. Pokud máte například dokument PDF s více fakturami, vytvořte pro každou fakturu samostatný soubor, než ji odešlete do modelu zpracování dokumentů.
Můžete také určit stránky, které má model zpracování dokumentu zpracovat. Tímto způsobem můžete využít výhod funkce modelu pro opakování stránky po stránce a zpracování jednoho formuláře najednou.
Další informace najdete v tématu Rozsah stránek.
Trénoval jsem model zpracování dokumentů, ale pokud jde o extrahovaná data, nedosahuji dobrých výsledků. Jak mohu model vylepšit?
Pokud váš model po trénování vrací špatné výsledky, upravte ho a poskytněte mu další vzorky pro trénování. Čím více vzorků poskytnete, tím více se model AI naučí extrahovat data z vašich dokumentů.
Více informací najdete v tématu Zlepšení výkonu modelu pro zpracování dokumentů.
Omezení
Jaký je maximální počet dokumentů, které mohu zpracovat?
Každých 60 sekund můžete zpracovat až 360 dokumentů v jednom prostředí.
Proč nejsou některé znaky rozpoznány správně?
- Může se stát, že se některé znaky spletou: 0 (číslo) a O (písmeno), 1 (číslo) a l (písmeno), 4 (číslo) a A (písmeno) a další.
- Může se stát, že některé znaky nad nebo blízko jiných nejsou rozpoznány správně: O (písmeno) přes svislou čáru se změní na 0 (číslo), 5 (číslo) na řádku se změní na $ (znak amerického dolaru), l_ (malé písmeno, podtržítko) se změní na L (velké písmeno) a další.
- Může se stát, že některé znaky na nekvalitních dokumentech budou rozpoznány nesprávně nebo vůbec.
V předchozích případech nelze v AI Builder pro zlepšení rozpoznávání udělat nic. Pro vyřešení podobných problémů doporučujeme zlepšit kvalitu a rozvržení zdrojového dokumentu.
Poznámka:
Microsoft neustále vylepšuje technologii optického rozpoznávání znaků (OCR) pro detekci znaků, takže k takovým problémům dochází méně často.
Mohu vytvořit model s mnoha kolekcemi?
Na jeden model můžete vytvořit až 200 kolekcí. Trénování modelů Obecné dokumenty na desítkách kolekcí však může trvat několik hodin a ve vzácných případech může vypršet časový limit. Pokud má váš model velký počet kolekcí, počkejte až 24 hodin na dokončení trénování modelu.
Můžu vytvořit model v řešení?
V současné době není možné vytvořit model v řešení.
Mohu použít smlouvy a dopisy ve svém modelu zpracování dokumentů?
Ano, nestrukturované dokumenty, jako jsou smlouvy a dopisy, jsou podporovány zpracováním dokumentů pomocí možnosti Obecné dokumenty.
Porovnání
Jaké jsou rozdíly mezi zpracováním dokumentů, zpracováním faktur, zpracováním příjemky, čtečkou osobních dokladů, čtečkou vizitek a rozpoznáváním textu?
V závislosti na vaší situaci budete možná muset použít konkrétní model nebo jejich kombinaci.
Rozpoznávání textu používejte, když chcete extrahovat veškerý text přítomný v obrázku nebo PDF. Potom můžete například hledat klíčové slovo v textu, který je extrahován, nebo vytvořit nějaká pevná pravidla pro extrahování určitých položek.
Pokud chcete extrahovat informace z faktur, účtenek, pasů, řidičských průkazů nebo vizitek, začněte s odpovídajícím předdefinovaným modelem:
- Zpracování faktur
- Zpracování potvrzení
- Čtečka dokladů totožnosti (pasy a řidičské průkazy)
- Čtečka vizitek
Tyto předem připravené modely můžete použít okamžitě, aniž byste museli vytvářet nový model. Tyto modely mohou extrahovat běžné informace nalezené v odpovídajícím typu dokumentu.
Pro jakýkoli jiný typ dokumentu můžete vytvořit vlastní model zpracování dokumentů pro extrahování polí a tabulek, které potřebujete. To platí také v případě, že potřebujete další informace, které předdefinovaný model neposkytuje.
Další informace najdete v tématu Vlastní model zpracování dokumentů.
Jaký je rozdíl mezi zpracováním dokumentů AI Builder a nástrojem Rozpoznávání formulářů Azure?
Zpracování dokumentů AI Builder je založeno na nástroji Rozpoznávání formulářů Azure. To poskytuje oběma produktům nejnovější vylepšení implementované v Microsoft AI.
AI Builder je součástí Microsoft Power Platform. To umožňuje komukoli přidat AI do aplikací a automatizace pomocí snadno použitelného rozhraní. Nemusíte být vývojář ani datový vědec.
Rozpoznávání formulářů Azure je zaměřeno na profesionální vývojáře. Ti mohou používat jednoduchá REST API k přidání funkcí AI do svých vlastních řešení kódu.
Možnosti v oblasti cen
Kolik zaplatím za zpracování dokumentů AI Builder?
Zpracování dokumentů můžete vyzkoušet zdarma spuštěním zkušebního období. Po vyhodnocení budete muset zakoupit kredity AI Builder pro použití zpracování dokumentů. Každá stránka, kterou zpracováváte při zpracování dokumentu, spotřebovává AI Builder kredity, i když stránka neobsahuje data k extrahování. Kredity AI Builder lze zakoupit prostřednictvím doplňků AI Builder.
Další informace najdete v tématu Licence AI Builder.