Modely zpracování dokumentů

Článek
04/07/2024

Důležité

Verze Document Intelligence ve verzi Public Preview poskytují dřívější přístup k funkcím, které jsou aktivní ve vývoji.
Funkce, přístupy a procesy se můžou před obecnou dostupností (GA) změnit na základě zpětné vazby uživatelů.
Verze Public Preview klientských knihoven Document Intelligence ve výchozím nastavení je rest API verze 2024-02-29-preview.
Verze Public Preview 2024-02-29-preview je aktuálně dostupná jenom v následujících oblastech Azure:
USA – východ
USA – západ 2
Západní Evropa

Tento obsah se vztahuje na:v4.0 (Preview) | Předchozí verze:v3.1 (GA)v3.0 (GA)v2.1 (GA)

Tento obsah se vztahuje na:v3.1 (GA) | Nejnovější verze:v4.0 (Preview) | Předchozí verze:v3.0v2.1

Tento obsah se vztahuje na:v3.0 (GA) | Nejnovější verze:v4.0 (Preview)v3.1 | Předchozí verze:v2.1

Tento obsah se vztahuje na:v2.1 | Nejnovější verze:v4.0 (Preview)

Azure AI Document Intelligence podporuje širokou škálu modelů, které umožňují přidat inteligentní zpracování dokumentů do aplikací a toků. Můžete použít předem vytvořený model specifický pro doménu nebo vytrénovat vlastní model přizpůsobený konkrétním obchodním potřebám a případům použití. Funkce Document Intelligence se dá použít s rozhraním REST API nebo pythonem, C#, Javou a javascriptovými klientskými knihovnami.

Přehled modelů

Následující tabulka ukazuje dostupné modely pro jednotlivé aktuální verze Preview a stabilní rozhraní API:

Typ modelu	Model	• 2024-02-29-preview Odrážka 2023-10-31-preview	31. 7. 2023 (GA)	31. 8. 2022 (GA)	v2.1 (GA)
Modely analýzy dokumentů	Přečíst	✔️	✔️	✔️	Není k dispozici
Modely analýzy dokumentů	Rozložení	✔️	✔️	✔️	✔️
Modely analýzy dokumentů	Obecný dokument	přesunuto do rozložení**	✔️	✔️	Není k dispozici
Předem vytvořené modely	Smlouva	✔️	✔️	Není k dispozici	Není k dispozici
Předem vytvořené modely	Zdravotní pojištění	✔️	✔️	✔️	Není k dispozici
Předem vytvořené modely	Průkaz totožnosti	✔️	✔️	✔️	✔️
Předem vytvořené modely	Faktura	✔️	✔️	✔️	✔️
Předem vytvořené modely	Příjmu	✔️	✔️	✔️	✔️
Předem vytvořené modely	US 1040 Tax*	✔️	✔️	Není k dispozici	Není k dispozici
Předem vytvořené modely	US 1098 Tax*	✔️	Není k dispozici	–	Není k dispozici
Předem vytvořené modely	US 1099 Tax*	✔️	Není k dispozici	–	Není k dispozici
Předem vytvořené modely	US W2 Tax	✔️	✔️	✔️	Není k dispozici
Předem vytvořené modely	US Hypotéka 1003 URLA	✔️	Není k dispozici	–	Není k dispozici
Předem vytvořené modely	Us Hypotéka 1008 Souhrn	✔️	Není k dispozici	–	Není k dispozici
Předem vytvořené modely	Zveřejnění uzavírací hypotéky v USA	✔️	Není k dispozici	–	Není k dispozici
Předem vytvořené modely	Manželství certifikátu	✔️	Není k dispozici	–	Není k dispozici
Předem vytvořené modely	Platební karta	✔️	Není k dispozici	–	Není k dispozici
Předem vytvořené modely	Vizitka	deprecated	✔️	✔️	✔️
Vlastní klasifikační model	Vlastní klasifikátor	✔️	✔️	Není k dispozici	Není k dispozici
Vlastní model extrakce	Vlastní neurální	✔️	✔️	✔️	Není k dispozici
Vlastní model pro odčítání	Vlastní šablona	✔️	✔️	✔️	✔️
Vlastní model extrakce	Vlastní složené	✔️	✔️	✔️	✔️
Všechny modely	Možnosti doplňků	✔️	✔️	Není k dispozici	Není k dispozici

* - Obsahuje podmodely. Informace o podporovaných variantáchach

Funkce doplňku	Doplněk nebo zdarma	• 2024-02-29-preview &bullet [2023-10-31-preview](/rest/api/aiservices/operation-groups?view=rest-aiservices-2024-02-29-preview&preserve-view=true	`2023-07-31` (GA)	`2022-08-31` (GA)	v2.1 (GA)
Extrakce vlastností písma	Doplněk	✔️	✔️	Není k dispozici	Není k dispozici
Extrakce vzorců	Doplněk	✔️	✔️	Není k dispozici	Není k dispozici
Extrakce s vysokým rozlišením	Doplněk	✔️	✔️	Není k dispozici	Není k dispozici
Extrakce čárových kódů	Bezplatný	✔️	✔️	Není k dispozici	Není k dispozici
Rozpoznávání jazyka	Bezplatný	✔️	✔️	Není k dispozici	Není k dispozici
Páry klíč-hodnota	Bezplatný	✔️	Není k dispozici	–	Není k dispozici
Pole dotazu	Doplněk*	✔️	Není k dispozici	–	Není k dispozici

Funkce analýzy modelů

ID modelu	Extrakce obsahu	Pole dotazu	Odstavce	Role odstavce	Značky výběru	Tabulky	Páry klíč-hodnota	Jazyky	Čárové kódy	Analýza dokumentů	Vzorce*	Písmo stylu*	Vysoké rozlišení*
předem připravená čtení	✓						O	O		O	O	O
předem připravené rozložení	✓	✓	✓	✓	✓	✓		O	O		O	O	O
předem připravený dokument	✓	✓	✓	✓	✓	✓	✓	O	O		O	O	O
předem připravená vizitka	✓	✓								✓
předem připravená smlouva	✓	✓	✓	✓			O	O	✓	O	O	O
prebuilt-healthInsuranceCard.us	✓	✓						O	O	✓	O	O	O
prebuilt-idDocument	✓	✓						O	O	✓	O	O	O
předem připravená faktura	✓	✓			✓	✓	O	O	O	✓	O	O	O
předem připravená potvrzení	✓	✓						O	O	✓	O	O	O
prebuilt-marriageCertificate.us	✓	✓						O	O	✓	O	O	O
předem připravená platební karta	✓	✓						O	O	✓	O	O	O
předem připravená hypotéka.us.1003	✓	✓						O	O	✓	O	O	O
předem připravená hypotéka.us.1008	✓	✓						O	O	✓	O	O	O
prebuilt-mortgage.us.closingDisclosure	✓	✓						O	O	✓	O	O	O
prebuilt-tax.us.w2	✓	✓			✓			O	O	✓	O	O	O
předem připravená-tax.us.1098	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.1098E	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.1098T	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.1099(varianty)	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.1040(varianty)	✓	✓						O	O	✓	O	O	O
{ customModelName }	✓	✓	✓	✓	✓	✓		O	O	✓	O	O	O

%% - Enabled
O - Optional
* - Premium features incur extra costs

Add-On* – Pole dotazu se za ceny liší od ostatních funkcí doplňku. Podrobnosti najdete na stránce s cenami .

Model	Popis
Modely analýzy dokumentů
Čtení OCR	Extrahujte tištěný a rukou psaný text včetně slov, umístění a rozpoznaných jazyků.
Analýza rozložení	Extrahujte prvky rozložení textu a dokumentu, jako jsou tabulky, značky výběru, názvy, nadpisy oddílů a další.
Předem připravené modely
Zdravotní pojištění	Automatizujte zdravotnické procesy extrahováním pojištění, člena, lékařského předpisu, čísla skupiny a dalších klíčových informací z amerických zdravotních pojištění.
Modely daňových dokumentů USA	Zpracujte daňové formuláře USA a extrahujte zaměstnance, zaměstnavatele, mzdu a další informace.
Modely dokumentů hypotéky v USA	Zpracujte americké hypotéky a extrahujte informace o půjčkách a nemovitostech dlužníka.
Smlouva	Extrahujte podrobnosti smlouvy a strany.
Faktura	Automatizujte faktury.
Příjmu	Extrahujte údaje o účtech z účtenek.
Dokument identity (ID)	Extrahujte pole identity (ID) z licencí řidiče USA a mezinárodních pasů.
Vizitka	Naskenujte vizitky a extrahujte do svých aplikací klíčová pole a data.
Vlastní modely
Vlastní model (přehled)	Extrahujte data z formulářů a dokumentů specifických pro vaši firmu. Vlastní modely se trénují pro různá data a případy použití.
Vlastní modely extrakce	● Vlastní modely šablon používají pomůcky rozložení k extrakci hodnot z dokumentů a jsou vhodné k extrakci polí z vysoce strukturovaných dokumentů s definovanými vizuálními šablonami. ● Vlastní neurální modely jsou trénovány na různých typech dokumentů k extrakci polí ze strukturovaných, částečně strukturovaných a nestrukturovaných dokumentů.
Vlastní klasifikační model	Model vlastní klasifikace může klasifikovat každou stránku ve vstupním souboru, aby identifikoval dokumenty v rámci a může také identifikovat více dokumentů nebo více instancí jednoho dokumentu ve vstupním souboru.
Složené modely	Kombinací několika vlastních modelů do jednoho modelu můžete automatizovat zpracování různých typů dokumentů s jedním složeným modelem.

U všech modelů kromě modelu vizitek teď funkce Document Intelligence podporuje funkce doplňků, které umožňují sofistikovanější analýzu. Tyto volitelné funkce je možné povolit a zakázat v závislosti na scénáři extrakce dokumentů. Pro verzi rozhraní API (GA) a novějších verzí rozhraní API je k dispozici 2023-07-31 sedm možností doplňků:

ocrHighResolution
formulas
styleFont
barcodes
languages
keyValuePairs (2024-02-29-preview, 2023-10-31-preview)
queryFields (2024-02-29-preview, 2023-10-31-preview) Not available with the US.Tax models

Podrobnosti o modelu

Tato část popisuje výstup, který můžete očekávat od každého modelu. Upozorňujeme, že výstup většiny modelů můžete rozšířit o funkce doplňků.

Čtení OCR

Rozhraní API pro čtení analyzuje a extrahuje řádky, slova, jejich umístění, rozpoznané jazyky a ručně psaný styl v případě zjištění.

Ukázkový dokument zpracovaný pomocí nástroje Document Intelligence Studio:

Snímek obrazovky s snímkem obrazovky s ukázkovým dokumentem zpracovaným pomocí nástroje Document Intelligence Studio read

Další informace: Model čtení

Analýza rozložení

Model analýzy rozložení analyzuje a extrahuje text, tabulky, značky výběru a další prvky struktury, jako jsou názvy, nadpisy oddílů, záhlaví stránek, zápatí stránek a další.

Ukázkový dokument zpracovaný pomocí nástroje Document Intelligence Studio:

Snímek obrazovky s ukázkovou stránkou novin zpracovaných pomocí nástroje Document Intelligence Studio

Další informace: Model rozložení

Zdravotní pojištění

Model zdravotní karty kombinuje výkonné funkce optického rozpoznávání znaků (OCR) s modely hlubokého učení k analýze a extrakci klíčových informací z amerických zdravotních pojištění.

Ukázka americké zdravotní pojištění zpracovaná pomocí nástroje Document Intelligence Studio:

Další informace: Model zdravotní pojištění

Daňové doklady USA

Modely daňových dokumentů USA analyzují a extrahují klíčová pole a řádkové položky z vybrané skupiny daňových dokladů. Rozhraní API podporuje analýzu daňových dokumentů usa v angličtině různých formátů a kvality, včetně obrázků zachycených telefonem, naskenovaných dokumentů a digitálních pdf souborů. V současné době se podporují následující modely:

Model	Popis	ID modelu
US Tax W-2	Extrahování podrobností o kompenzaci k dani.	prebuilt-tax.us.W-2
US Tax 1040	Extrahujte podrobnosti o hypotékách.	prebuilt-tax.us.1040(varianty)
US Tax 1098	Extrahujte podrobnosti o hypotékách.	prebuilt-tax.us.1098(varianty)
US Tax 1099	Extrahujte příjmy získané z jiných zdrojů než zaměstnavatele.	prebuilt-tax.us.1099(varianty)

Ukázkový dokument W-2 zpracovaný pomocí nástroje Document Intelligence Studio:

Snímek obrazovky s ukázkou W-2

Další informace: Modely daňových dokumentů

Americké hypotéky dokumenty

Modely dokumentů hypoték v USA analyzují a extrahují klíčová pole, včetně informací o dlužníku, půjčkách a nemovitostech z vybrané skupiny hypoték. Rozhraní API podporuje analýzu amerických hypoték anglického jazyka různých formátů a kvality, včetně obrázků zachycených telefonem, naskenovaných dokumentů a digitálních pdf souborů. V současné době se podporují následující modely:

Model	Popis	ID modelu
1003 Licenční smlouva s koncovým uživatelem (EULA)	Extrahovat půjčku, dlužníka, podrobnosti o nemovitosti.	předem připravená hypotéka.us.1003
Souhrnný dokument 1008	Extrahujte dlužníka, prodejce, nemovitosti, hypotéku a podrobnosti o započtení.	předem připravená hypotéka.us.1008
Závěrečné zveřejnění	Extrahujte závěrečné, transakční náklady a podrobnosti o půjčkách.	prebuilt-mortgage.us.closingDisclosure
Manželství certifikátu	Extrahujte podrobnosti o manželství pro žadatele o společný úvěr.	prebuilt-marriageCertificate
US Tax W-2	Extrahujte podrobnosti o dani z důvodu ověření příjmu.	prebuilt-tax.us.W-2

Ukázkový dokument o zavření vyzrazení zpracovaný pomocí nástroje Document Intelligence Studio:

Snímek obrazovky s ukázkovým zveřejněním závěru

Další informace: Modely hypoték

Smlouva

Model kontraktu analyzuje a extrahuje klíčová pole a řádkové položky ze smluvních smluv, včetně stran, jurisdikcí, ID smlouvy a názvu. Model aktuálně podporuje dokumenty kontraktů v angličtině.

Ukázkový kontrakt zpracovaný pomocí nástroje Document Intelligence Studio:

Snímek obrazovky extrakce modelu kontraktu pomocí nástroje Document Intelligence Studio

Další informace: Model kontraktu

Faktura

Model faktury automatizuje zpracování faktur a extrahuje jméno zákazníka, fakturační adresu, termín splatnosti a splatnou částku, řádkové položky a další klíčová data. V současné době model podporuje faktury za angličtinu, španělštinu, němčinu, francouzštinu, italštinu, portugalštinu a nizozemštinu.

Ukázková faktura zpracovaná pomocí nástroje Document Intelligence Studio:

Další informace: Model faktury

Potvrzení

Pomocí modelu účtenek můžete zkontrolovat prodejní účtenky pro obchodní jméno, kalendářní data, řádkové položky, množství a součty z tištěných a ručně psaných účtenek. Verze v3.0 také podporuje jednostránkové zpracování potvrzení o hotelech.

Ukázkový příjem zpracovaný pomocí nástroje Document Intelligence Studio:

Další informace: Model účtenek

Dokument identity (ID)

Pomocí modelu dokument identity (ID) můžete zpracovat licence řidiče USA (všech 50 států a okresu Columbia) a životopisné stránky z mezinárodních pasů (s výjimkou víza a dalších cestovních dokumentů) k extrakci klíčových polí.

Ukázková licence řidiče v USA zpracovaná pomocí nástroje Document Intelligence Studio:

Další informace: Model dokumentů identit

Manželství certifikátu

Pomocí modelu certifikátu manželství můžete zpracovávat certifikáty manželství v USA k extrakci klíčových polí, včetně jednotlivců, data a místa.

Ukázkový certifikát manželství v USA zpracovaný pomocí nástroje Document Intelligence Studio:

Další informace: Model dokumentů identit

Platební karta

Pomocí modelu kreditní karty můžete zpracovávat kreditní a debetní karty k extrakci polí klíče.

Ukázková platební karta zpracovaná pomocí nástroje Document Intelligence Studio:

Další informace: Model dokumentů identit

Vlastní modely

Vlastní modely lze široce klasifikovat do dvou typů. Vlastní klasifikační modely, které podporují klasifikaci typu dokumentu a vlastní modely extrakce, které můžou extrahovat definované schéma z konkrétního typu dokumentu.

Diagram typů vlastních modelů a přidružených režimů sestavení modelu

Vlastní modely dokumentů analyzují a extrahují data z formulářů a dokumentů specifických pro vaši firmu. Vytrénují se tak, aby rozpoznala pole formulářů v rámci vašeho jedinečného obsahu a extrahovala páry klíč-hodnota a data tabulky. Abyste mohli začít, potřebujete jenom jeden příklad typu formuláře.

Vlastní model verze 3.0 podporuje detekci podpisů ve vlastní šabloně (formuláři) a křížových tabulkách v šablonách i neurálních modelech.

Ukázková vlastní šablona zpracovaná pomocí nástroje Document Intelligence Studio:

Snímek obrazovky nástroje Document Intelligence s možností analyzovat okno vlastního formuláře

Další informace: Vlastní model

Vlastní extrakce

Vlastní model extrakce může být jeden ze dvou typů, vlastní šablona nebo vlastní neurální. Pokud chcete vytvořit vlastní model extrakce, označte datovou sadu dokumentů hodnotami, které chcete extrahovat, a vytrénujte model na označené datové sadě. Abyste mohli začít, potřebujete jenom pět příkladů stejného formuláře nebo typu dokumentu.

Ukázková vlastní extrakce zpracovaná pomocí nástroje Document Intelligence Studio:

Snímek obrazovky s analýzou vlastního modelu extrakce v nástroji Document Intelligence Studio

Další informace: Vlastní model šablony

Další informace: Vlastní neurální model

Vlastní klasifikátor

Vlastní klasifikační model umožňuje identifikovat typ dokumentu před vyvoláním modelu extrakce. Klasifikační model je k dispozici od 2023-07-31 (GA) rozhraní API. Trénování vlastního klasifikačního modelu vyžaduje alespoň dvě odlišné třídy a minimálně pět vzorků na třídu.

Další informace: Vlastní klasifikační model

Složené modely

Složený model se vytvoří tak, že vezme kolekci vlastních modelů a přiřadí je k jednomu modelu vytvořenému z vašich typů formulářů. Můžete přiřadit více vlastních modelů složeným modelům volaným s jedním ID modelu. K jednomu složeného modelu můžete přiřadit až 200 trénovaných vlastních modelů.

Okno dialogového okna Složený model v nástroji Document Intelligence Studio:

Snímek obrazovky s dialogovým oknem pro vytvoření vlastního modelu v sadě Document Intelligence Studio

Další informace: Vlastní model

Požadavky na vstup

Nejlepšíchvýsledkůch

Podporované formáty souborů:

Model	PDF	Obrázek: JPEG/JPG, PNG, BMP, TIFF, HEIF	systém Microsoft Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX) a HTML
Čteno	✔	✔	✔
Rozložení	✔	✔	✔ (2024-02-29-preview, 2023-10-31-preview)
Obecný dokument	✔	✔
Předpřipravený	✔	✔
Vlastní extrakce	✔	✔
Vlastní klasifikace	✔	✔	✔ (29. 2024. 2024)

U SOUBORŮ PDF a TIFF je možné zpracovat až 2000 stránek (s předplatným úrovně Free se zpracovávají pouze první dvě stránky).
Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a 4 MB pro bezplatnou úroveň (F0).
Rozměry obrázku musí být mezi 50 x 50 pixelů a 10 000 px x 10 000 pixelů.
Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.
Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá 8150 bodům na palec (DPI).
Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.
- Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a 1G MB pro neurální model.
- Pro trénování modelu vlastní klasifikace je 1GB celková velikost trénovacích dat s maximálně 10 000 stránkami.

Poznámka:

Nástroj Sample Labeling nepodporuje formát souboru BMP. Jedná se o omezení nástroje, nikoli služby Document Intelligence.

Migrace verzí

Naučte se ve svých aplikacích používat Document Intelligence v3.0 podle našeho průvodce migrací Document Intelligence v3.1.

Model	Popis
Analýza dokumentů
Rozložení	Extrahujte informace o textu a rozložení z dokumentů.
Předem připravené
Faktura	Extrahujte klíčové informace z anglické a španělské faktury.
Příjmu	Extrahujte klíčové informace z anglických účtenek.
Průkaz totožnosti	Extrahujte klíčové informace z licencí na řidiče USA a mezinárodních pasů.
Vizitka	Extrahujte klíčové informace z anglických vizitek.
Vlastní
Vlastní	Extrahujte data z formulářů a dokumentů specifických pro vaši firmu. Vlastní modely se trénují pro různá data a případy použití.
Skládá	Vytvořte kolekci vlastních modelů a přiřaďte je k jednomu modelu vytvořenému z typů formulářů.