Model potvrzení o dokumentech
Důležité
- Verze Document Intelligence ve verzi Public Preview poskytují dřívější přístup k funkcím, které jsou aktivní ve vývoji. Funkce, přístupy a procesy se můžou před obecnou dostupností (GA) změnit na základě zpětné vazby uživatelů.
- Verze Public Preview klientských knihoven Document Intelligence je výchozí pro rozhraní REST API verze 2024-07-31-preview.
- Verze Public Preview 2024-07-31-preview je aktuálně dostupná jenom v následujících oblastech Azure. Všimněte si, že vlastní model generování (extrakce polí dokumentu) v AI Studiu je k dispozici pouze v oblasti USA – středosever:
- USA – východ
- USA – západ 2
- Západní Evropa
- USA – středosever
Tento obsah se vztahuje na: v4.0 (Preview) | Předchozí verze: v3.1 (GA) v3.0 (GA) v2.1 (GA)
Tento obsah se vztahuje na: v3.1 (GA) | Nejnovější verze: v4.0 (Preview) | Předchozí verze: v3.0 v2.1
Tento obsah se vztahuje na: v3.0 (GA) | Nejnovější verze: v4.0 (Preview) v3.1 | Předchozí verze: v2.1
Tento obsah se vztahuje na: v2.1 | Nejnovější verze: v4.0 (Preview)
Model účtenky Document Intelligence kombinuje výkonné funkce optického rozpoznávání znaků (OCR) s modely hlubokého učení, které analyzují a extrahují klíčové informace z prodejních účtenek. Účtenky můžou mít různé formáty a kvalitu včetně tištěných a rukou psaných účtenek. Rozhraní API extrahuje klíčové informace, jako je název obchodníka, telefonní číslo obchodníka, datum transakce, daň a celkový součet transakcí a vrací strukturovaná data JSON.
Podporované typy účtenek:
- Tepelný
- Platební karta
- Gas
- Parkoviště
- Hotel
- Doprava
- Komunikace
- Zábava
- Let
- Školení
- Lékárna /Lékařské
Extrakce údajů o účtech
Digitalizace účtenek zahrnuje transformaci různých typů účtenek, včetně naskenovaných, fotografovaných a tištěných kopií, do digitálního formátu pro zjednodušené zpracování podřízeného procesu. Mezi příklady patří správa výdajů, analýza chování spotřebitelů, automatizace daní atd. Použití technologie Document Intelligence s technologií OCR (Optické rozpoznávání znaků) může extrahovat a interpretovat data z těchto různých formátů účtenek. Zpracování funkce Document Intelligence zjednodušuje proces převodu, ale také výrazně zkracuje čas a úsilí, což usnadňuje efektivní správu dat a načítání.
Ukázkový příjem zpracovaný pomocí nástroje Document Intelligence Studio:
Ukázková účtenka zpracována pomocí nástroje Popisování ukázek funkce Document Intelligence:
Možnosti vývoje
Document Intelligence v4.0 (2024-07-07-31-preview) podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací | ID modelu |
---|---|---|
Model účtenek | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK• JavaScript SDK |
předem připravená potvrzení |
Document Intelligence v3.1 podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací | ID modelu |
---|---|---|
Model účtenek | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK• JavaScript SDK |
předem připravená potvrzení |
Document Intelligence v3.0 podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací | ID modelu |
---|---|---|
Model účtenek | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK• JavaScript SDK |
předem připravená potvrzení |
Document Intelligence v2.1 podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací |
---|---|
Model účtenek | • Nástroj pro popisování document intelligence• REST API • sada SDK klientské knihovny• Kontejner Document Intelligence Dockeru |
Požadavky na vstup
Podporované formáty souborů:
Model PDF Obrázek: JPEG/JPG
,PNG
,BMP
,TIFF
,HEIF
systém Microsoft Office:
Word (DOCX
), Excel (XLSX
), PowerPoint (PPTX
), HTMLČteno ✔ ✔ ✔ Rozložení ✔ ✔ ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview) Obecný dokument ✔ ✔ Předpřipravený ✔ ✔ Vlastní extrakce ✔ ✔ Vlastní klasifikace ✔ ✔ ✔ (31. 7. 2024, 2024-02-29-preview) Nejlepšíchvýsledkůch
U SOUBORŮ PDF a TIFF je možné zpracovat až 2 000 stránek (s předplatným úrovně Free se zpracuje pouze první dvě stránky).
Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a
4
MB pro bezplatnou úroveň (F0).Rozměry obrázku musí být mezi 50 pixely x 50 pixelů a 10 000 pixelů x 10 000 pixelů.
Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.
Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá
8
bodě textu na 150 bodů na palec (DPI).Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.
Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a
1
GB pro neurální model.Pro trénování modelu vlastní klasifikace je
1
celková velikost trénovacích dat GB s maximálně 10 000 stránkami. Pro verzi 2024-07-31-preview a novější je2
celková velikost trénovacích dat GB s maximálně 10 000 stránkami.
- Podporované formáty souborů: JPEG, PNG, PDF a TIFF.
- Podporovaný příspěvek na stránky pro PDF a TIFF: Funkce Document Intelligence může zpracovat až 2 000 stránek pro předplatitele standardní vrstvy nebo pouze první dvě stránky pro předplatitele úrovně Free.
- Podporovaná velikost souboru: menší než 50 MB; minimální pixely 50 x 50 px; maximálně 10 000 × 10 000 pixelů.
Extrakce dat modelu účtenek
Podívejte se, jak funkce Document Intelligence extrahuje data, včetně času a data transakcí, informací o obchodních údajích a součtů částky z účtenek. Potřebujete následující zdroje informací:
Předplatné Azure – můžete si ho zdarma vytvořit.
Instance Document Intelligence na webu Azure Portal K vyzkoušení služby můžete použít cenovou úroveň Free (
F0
). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod.
Poznámka:
Document Intelligence Studio je k dispozici s rozhraními API v3.1 a v3.0 a novějšími verzemi.
Na domovské stránce nástroje Document Intelligence Studio vyberte Potvrzení.
Můžete analyzovat ukázkové potvrzení nebo nahrát vlastní soubory.
Vyberte tlačítko Spustit analýzu a v případě potřeby nakonfigurujte možnosti Analyzovat:
Nástroj Document Intelligence Sample Labeling
Přejděte k nástroji Ukázka funkce Document Intelligence.
Na domovské stránce ukázkového nástroje vyberte k získání dlaždice s daty předem vytvořený model.
V rozevírací nabídce vyberte typ formuláře, který chcete analyzovat.
Vyberte adresu URL souboru, který chcete analyzovat, z následujících možností:
Ukázkový dokument faktury
Ukázkový dokument s ID
Ukázkový obrázek potvrzení
V poli Zdroj vyberte adresu URL z rozevírací nabídky, vložte vybranou adresu URL a vyberte tlačítko Načíst.
Do pole koncový bod služby Document Intelligence vložte koncový bod, který jste získali s předplatným Document Intelligence.
Do pole s klíčem vložte klíč, který jste získali z prostředku Document Intelligence.
Vyberte Spustit analýzu. Nástroj Popisování ukázek funkce Document Intelligence volá předem připravené rozhraní API pro analýzu a analyzuje dokument.
Prohlédněte si výsledky – prohlédněte si páry klíč-hodnota extrahované, řádkové položky, zvýrazněný text extrahovaný a zjištěné tabulky.
Poznámka:
Nástroj Sample Labeling nepodporuje formát souboru BMP. Jedná se o omezení nástroje, nikoli služby Document Intelligence.
Podporované jazyky a národní prostředí
Úplný seznam podporovaných jazyků najdete na naší stránce podpory předem připravených modelů.
Extrakce polí
Name | Typ | Popis | Standardizovaný výstup |
---|---|---|---|
ReceiptType | String | Typ potvrzení o prodeji | Rozepsaný |
MerchantName | String | Název obchodníka vydávajícího účtenku | |
MerchantPhoneNumber | phoneNumber | Uvedené telefonní číslo obchodníka | +1 xxx xxx xxxx |
MerchantAddress | String | Uvedená adresa obchodníka | |
TransactionDate | Datum | Datum vystavení potvrzení | yyyy-mm-dd |
TransactionTime | Čas | Čas vydání účtenky | hh-mm-ss (24 hodin) |
Celkem | Číslo (USD) | Celkový součet příjmu za celou transakci | Dvou desetinná čárka s plovoucí desetinnou čárkou |
Dílčí součet | Číslo (USD) | Mezisoučet příjmu, často před uplatněním daní | Dvou desetinná čárka s plovoucí desetinnou čárkou |
Daň | Číslo (USD) | Celková daň z příjmu (často daň z prodeje nebo ekvivalent). Přejmenováno na TotalTax ve verzi 2022-06-30. | Dvou desetinná čárka s plovoucí desetinnou čárkou |
Tip | Číslo (USD) | Tip zahrnutý kupujícím | Dvou desetinná čárka s plovoucí desetinnou čárkou |
Items | Pole řetězců | Extrahované řádkové položky s názvem, množstvím, jednotkovou cenou a extrahovanou celkovou cenou | |
Název | String | Popis položky Přejmenováno na Popis ve verzi 2022-06-30. | |
Množství | Počet | Množství každé položky | Dvou desetinná čárka s plovoucí desetinnou čárkou |
Cena | Počet | Individuální cena každé jednotky položky | Dvou desetinná čárka s plovoucí desetinnou čárkou |
TotalPrice | Počet | Celková cena řádkové položky | Dvou desetinná čárka s plovoucí desetinnou čárkou |
Podporovaná pole pro extrakci dokumentů najdete na stránce schématu modelu účtenek v našem ukázkovém úložišti GitHubu.
Průvodce migrací a rozhraní REST API verze 3.1
- Postupujte podle našeho průvodce migrací Document Intelligence v3.1 a zjistěte, jak používat verzi v3.1 ve vašich aplikacích a pracovních postupech.
Další kroky
Zkuste pomocí nástroje Document Intelligence Studio zpracovat vlastní formuláře a dokumenty.
Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.
Zkuste zpracovat vlastní formuláře a dokumenty pomocí nástroje Document Intelligence Sample Labeling.
Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.