Model potvrzení o dokumentech

Důležité

  • Verze Document Intelligence ve verzi Public Preview poskytují dřívější přístup k funkcím, které jsou aktivní ve vývoji.
  • Funkce, přístupy a procesy se můžou před obecnou dostupností (GA) změnit na základě zpětné vazby uživatelů.
  • Verze Public Preview klientských knihoven Document Intelligence ve výchozím nastavení je rest API verze 2024-02-29-preview.
  • Verze Public Preview 2024-02-29-preview je aktuálně dostupná jenom v následujících oblastech Azure:
  • USA – východ
  • USA – západ 2
  • Západní Evropa

Tento obsah se vztahuje na:Zaškrtnutív4.0 (Preview) | Předchozí verze:modrá značka zaškrtnutív3.1 (GA)modrá značka zaškrtnutív3.0 (GA)modrá značka zaškrtnutív2.1 (GA)

Tento obsah se vztahuje na:Zaškrtnutív3.1 (GA) | Nejnovější verze:nachová značka zaškrtnutív4.0 (Preview) | Předchozí verze:modrá značka zaškrtnutív3.0modrá značka zaškrtnutív2.1

Tento obsah se vztahuje na:Zaškrtnutív3.0 (GA) | Nejnovější verze:nachová značka zaškrtnutív4.0 (Preview)nachová značka zaškrtnutív3.1 | Předchozí verze:modrá značka zaškrtnutív2.1

Tento obsah se vztahuje na:Zaškrtnutív2.1 | Nejnovější verze:modrá značka zaškrtnutív4.0 (Preview)

Model účtenky Document Intelligence kombinuje výkonné funkce optického rozpoznávání znaků (OCR) s modely hlubokého učení, které analyzují a extrahují klíčové informace z prodejních účtenek. Účtenky můžou mít různé formáty a kvalitu včetně tištěných a rukou psaných účtenek. Rozhraní API extrahuje klíčové informace, jako je název obchodníka, telefonní číslo obchodníka, datum transakce, daň a celkový součet transakcí a vrací strukturovaná data JSON.

Podporované typy účtenek:

  • Tepelné
  • Platební karta
  • Gas
  • Parkování
  • Hotel
  • Doprava
  • Komunikace
  • Zábava
  • Let
  • Školení
  • Lékárna /Lékařské

Extrakce údajů o účtech

Digitalizace účtenek zahrnuje transformaci různých typů účtenek, včetně naskenovaných, fotografovaných a tištěných kopií, do digitálního formátu pro zjednodušené zpracování podřízeného procesu. Mezi příklady patří správa výdajů, analýza chování spotřebitelů, automatizace daní atd. Použití technologie Document Intelligence s technologií OCR (Optické rozpoznávání znaků) může extrahovat a interpretovat data z těchto různých formátů účtenek. Zpracování funkce Document Intelligence zjednodušuje proces převodu, ale také výrazně zkracuje čas a úsilí, což usnadňuje efektivní správu dat a načítání.

Ukázkový příjem zpracovaný pomocí nástroje Document Intelligence Studio:

Snímek obrazovky s ukázkovým účtem zpracovaným v nástroji Document Intelligence Studio

Ukázková účtenka zpracována pomocí nástroje Popisování ukázek funkce Document Intelligence:

Snímek obrazovky s ukázkovým potvrzením zpracovaným pomocí nástroje Pro popisování vzorového formuláře

Možnosti vývoje

Document Intelligence v4.0 (2024-02-02-29-preview, 2023-10-31-preview) podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací ID modelu
Model účtenek Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
• JavaScript SDK• JavaScript SDK
předem připravená potvrzení

Document Intelligence v3.1 podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací ID modelu
Model účtenek Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
• JavaScript SDK• JavaScript SDK
předem připravená potvrzení

Document Intelligence v3.0 podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací ID modelu
Model účtenek Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
• JavaScript SDK• JavaScript SDK
předem připravená potvrzení

Document Intelligence v2.1 podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací
Model účtenek Nástroj pro
popisování document intelligence• REST API
sada SDK
klientské knihovny• Kontejner Document Intelligence Dockeru

Požadavky na vstup

  • Nejlepšíchvýsledkůch

  • Podporované formáty souborů:

    Model PDF Obrázek:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    systém Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) a HTML
    Čteno
    Rozložení ✔ (2024-02-29-preview, 2023-10-31-preview)
    Obecný dokument
    Předpřipravený
    Vlastní extrakce
    Vlastní klasifikace ✔ (29. 2024. 2024)
  • U SOUBORŮ PDF a TIFF je možné zpracovat až 2000 stránek (s předplatným úrovně Free se zpracovávají pouze první dvě stránky).

  • Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a 4 MB pro bezplatnou úroveň (F0).

  • Rozměry obrázku musí být mezi 50 x 50 pixelů a 10 000 px x 10 000 pixelů.

  • Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.

  • Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá 8150 bodům na palec (DPI).

  • Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.

    • Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a 1G MB pro neurální model.

    • Pro trénování modelu vlastní klasifikace je 1GB celková velikost trénovacích dat s maximálně 10 000 stránkami.

  • Podporované formáty souborů: JPEG, PNG, PDF a TIFF.
  • Podporovaný příspěvek na stránky pro PDF a TIFF: Funkce Document Intelligence může zpracovat až 2 000 stránek pro předplatitele standardní vrstvy nebo pouze první dvě stránky pro předplatitele úrovně Free.
  • Podporovaná velikost souboru: menší než 50 MB; minimální pixely 50 x 50 px; maximálně 10 000 × 10 000 pixelů.

Extrakce dat modelu účtenek

Podívejte se, jak funkce Document Intelligence extrahuje data, včetně času a data transakcí, informací o obchodních údajích a součtů částky z účtenek. Potřebujete následující zdroje informací:

  • Předplatné Azure – můžete si ho zdarma vytvořit.

  • Instance Document Intelligence na webu Azure Portal K vyzkoušení služby můžete použít cenovou úroveň Free (F0). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod.

Snímek obrazovky s klíči a umístěním koncového bodu na webu Azure Portal

Poznámka:

Document Intelligence Studio je k dispozici s rozhraními API v3.1 a v3.0 a novějšími verzemi.

  1. Na domovské stránce nástroje Document Intelligence Studio vyberte Potvrzení.

  2. Můžete analyzovat ukázkové potvrzení nebo nahrát vlastní soubory.

  3. Vyberte tlačítko Spustit analýzu a v případě potřeby nakonfigurujte možnosti Analyzovat:

    Snímek obrazovky s tlačítky Možnosti Spustit analýzu a Analýza v nástroji Document Intelligence Studio

Nástroj Document Intelligence Sample Labeling

  1. Přejděte k nástroji Ukázka funkce Document Intelligence.

  2. Na domovské stránce ukázkového nástroje vyberte k získání dlaždice s daty předem vytvořený model.

    Snímek obrazovky s procesem analýzy výsledků modelu rozložení

  3. V rozevírací nabídce vyberte typ formuláře, který chcete analyzovat.

  4. Vyberte adresu URL souboru, který chcete analyzovat, z následujících možností:

  5. V poli Zdroj vyberte adresu URL z rozevírací nabídky, vložte vybranou adresu URL a vyberte tlačítko Načíst.

    Snímek obrazovky s rozevírací nabídkou umístění zdroje

  6. Do pole koncový bod služby Document Intelligence vložte koncový bod, který jste získali s předplatným Document Intelligence.

  7. Do pole s klíčem vložte klíč, který jste získali z prostředku Document Intelligence.

    Snímek obrazovky s rozevírací nabídkou select-form-type

  8. Vyberte Spustit analýzu. Nástroj Popisování ukázek funkce Document Intelligence volá předem připravené rozhraní API pro analýzu a analyzuje dokument.

  9. Prohlédněte si výsledky – prohlédněte si páry klíč-hodnota extrahované, řádkové položky, zvýrazněný text extrahovaný a zjištěné tabulky.

    Snímek obrazovky s operací analýzy výsledků modelu rozložení

Poznámka:

Nástroj Sample Labeling nepodporuje formát souboru BMP. Jedná se o omezení nástroje, nikoli služby Document Intelligence.

Podporované jazyky a národní prostředí

Úplný seznam podporovaných jazyků najdete na stránce podpory jazyků – předem připravená stránka modelů .

Extrakce polí

Name Typ Popis Standardizovaný výstup
ReceiptType String Typ potvrzení o prodeji Rozpis
MerchantName String Název obchodníka vydávajícího účtenku
Merchant Telefon Number phoneNumber Uvedené telefonní číslo obchodníka +1 xxx xxx xxxx
MerchantAddress String Uvedená adresa obchodníka
TransactionDate Datum Datum vystavení potvrzení yyyy-mm-dd
TransactionTime Čas Čas vydání účtenky hh-mm-ss (24 hodin)
Celkem Číslo (USD) Celkový součet příjmu za celou transakci Dvou desetinná čárka s plovoucí desetinnou čárkou
Dílčí součet Číslo (USD) Mezisoučet příjmu, často před uplatněním daní Dvou desetinná čárka s plovoucí desetinnou čárkou
Daň Číslo (USD) Celková daň z příjmu (často daň z prodeje nebo ekvivalent). Přejmenováno na TotalTax ve verzi 2022-06-30. Dvou desetinná čárka s plovoucí desetinnou čárkou
Tip Číslo (USD) Tip zahrnutý kupujícím Dvou desetinná čárka s plovoucí desetinnou čárkou
Items Pole řetězců Extrahované řádkové položky s názvem, množstvím, jednotkovou cenou a extrahovanou celkovou cenou
Název String Popis položky Přejmenováno na Popis ve verzi 2022-06-30.
Množství Počet Množství každé položky Dvou desetinná čárka s plovoucí desetinnou čárkou
Cena Počet Individuální cena každé jednotky položky Dvou desetinná čárka s plovoucí desetinnou čárkou
TotalPrice Počet Celková cena řádkové položky Dvou desetinná čárka s plovoucí desetinnou čárkou

Funkce Document Intelligence verze 3.0 a novější přináší několik nových funkcí a možností. Kromě tepelných účtenek model účtenek podporuje jednostránkové zpracování účtenek a extrakci podrobností o dani pro všechny typy účtenek.

Document Intelligence verze 4.0 a novější zavádí podporu pro měnu pro všechna cenová pole pro termální a hotelové účtenky.

Potvrzení

Pole Typ Popis Příklad
MerchantName string Název obchodníka vydávajícího účtenku Contoso
MerchantPhoneNumber phoneNumber Uvedené telefonní číslo obchodníka 987-654-3210
MerchantAddress address Uvedená adresa obchodníka 123 Main St. Redmond, Washington 98052
Total number Celkový součet příjmu za celou transakci 14,34 Kč
TransactionDate date Datum vystavení potvrzení 6. června 2019
TransactionTime time Čas vydání účtenky 17:49
Subtotal number Mezisoučet příjmu, často před uplatněním daní 12,34 Kč
TotalTax number Daň z příjmu, často dph nebo ekvivalentní 2,00 USD
Tip number Tip zahrnutý kupujícím $1,00
Items array
Items.* object Extrahovaná položka řádku 0
Surface Pro 6
999,00 Kč
999,00 Kč
Items.*.TotalPrice number Celková cena řádkové položky 999,00 Kč
Items.*.Description string Popis položky Surface Pro 6
Items.*.Quantity number Množství každé položky 0
Items.*.Price number Individuální cena každé jednotky položky 999,00 Kč
Items.*.ProductCode string Kód produktu, číslo výrobku nebo skladová položka přidružená ke konkrétní položce řádku A123
Items.*.QuantityUnit string Jednotku množství každé položky
TaxDetails array
TaxDetails.* object Extrahovaná položka řádku 0
Surface Pro 6
999,00 Kč
999,00 Kč
TaxDetails.*.Amount currency Výše podrobností o dani 999,00 Kč

receipt.retailMeal

Pole Typ Popis Příklad
MerchantName string Název obchodníka vydávajícího účtenku Contoso
MerchantPhoneNumber phoneNumber Uvedené telefonní číslo obchodníka 987-654-3210
MerchantAddress address Uvedená adresa obchodníka 123 Main St. Redmond, Washington 98052
Total number Celkový součet příjmu za celou transakci 14,34 Kč
TransactionDate date Datum vystavení potvrzení 6. června 2019
TransactionTime time Čas vydání účtenky 17:49
Subtotal number Mezisoučet příjmu, často před uplatněním daní 12,34 Kč
TotalTax number Daň z příjmu, často dph nebo ekvivalentní 2,00 USD
Tip number Tip zahrnutý kupujícím $1,00
Items array
Items.* object Extrahovaná položka řádku 0
Surface Pro 6
999,00 Kč
999,00 Kč
Items.*.TotalPrice number Celková cena řádkové položky 999,00 Kč
Items.*.Description string Popis položky Surface Pro 6
Items.*.Quantity number Množství každé položky 0
Items.*.Price number Individuální cena každé jednotky položky 999,00 Kč
Items.*.ProductCode string Kód produktu, číslo výrobku nebo skladová položka přidružená ke konkrétní položce řádku A123
Items.*.QuantityUnit string Jednotku množství každé položky
TaxDetails array
TaxDetails.* object Extrahovaná položka řádku 0
Surface Pro 6
999,00 Kč
999,00 Kč
TaxDetails.*.Amount currency Výše podrobností o dani 999,00 Kč

receipt.creditCard

Pole Typ Popis Příklad
MerchantName string Název obchodníka vydávajícího účtenku Contoso
MerchantPhoneNumber phoneNumber Uvedené telefonní číslo obchodníka 987-654-3210
MerchantAddress address Uvedená adresa obchodníka 123 Main St. Redmond, Washington 98052
Total number Celkový součet příjmu za celou transakci 14,34 Kč
TransactionDate date Datum vystavení potvrzení 6. června 2019
TransactionTime time Čas vydání účtenky 17:49
Subtotal number Mezisoučet příjmu, často před uplatněním daní 12,34 Kč
TotalTax number Daň z příjmu, často dph nebo ekvivalentní 2,00 USD
Tip number Tip zahrnutý kupujícím $1,00
Items array
Items.* object Extrahovaná položka řádku 0
Surface Pro 6
999,00 Kč
999,00 Kč
Items.*.TotalPrice number Celková cena řádkové položky 999,00 Kč
Items.*.Description string Popis položky Surface Pro 6
Items.*.Quantity number Množství každé položky 0
Items.*.Price number Individuální cena každé jednotky položky 999,00 Kč
Items.*.ProductCode string Kód produktu, číslo výrobku nebo skladová položka přidružená ke konkrétní položce řádku A123
Items.*.QuantityUnit string Jednotku množství každé položky
TaxDetails array
TaxDetails.* object Extrahovaná položka řádku 0
Surface Pro 6
999,00 Kč
999,00 Kč
TaxDetails.*.Amount currency Výše podrobností o dani 999,00 Kč

účtenka.plyn

Pole Typ Popis Příklad
MerchantName string Název obchodníka vydávajícího účtenku Contoso
MerchantPhoneNumber phoneNumber Uvedené telefonní číslo obchodníka 987-654-3210
MerchantAddress address Uvedená adresa obchodníka 123 Main St. Redmond, Washington 98052
Total number Celkový součet příjmu za celou transakci 14,34 Kč
TransactionDate date Datum vystavení potvrzení 6. června 2019
TransactionTime time Čas vydání účtenky 17:49
Subtotal number Mezisoučet příjmu, často před uplatněním daní 12,34 Kč
TotalTax number Daň z příjmu, často dph nebo ekvivalentní 2,00 USD
Tip number Tip zahrnutý kupujícím $1,00
Items array
Items.* object Extrahovaná položka řádku 0
Surface Pro 6
999,00 Kč
999,00 Kč
Items.*.TotalPrice number Celková cena řádkové položky 999,00 Kč
Items.*.Description string Popis položky Surface Pro 6
Items.*.Quantity number Množství každé položky 0
Items.*.Price number Individuální cena každé jednotky položky 999,00 Kč
Items.*.ProductCode string Kód produktu, číslo výrobku nebo skladová položka přidružená ke konkrétní položce řádku A123
Items.*.QuantityUnit string Jednotku množství každé položky
TaxDetails array
TaxDetails.* object Extrahovaná položka řádku 0
Surface Pro 6
999,00 Kč
999,00 Kč
TaxDetails.*.Amount currency Výše podrobností o dani 999,00 Kč

účtenka.parkování

Pole Typ Popis Příklad
MerchantName string Název obchodníka vydávajícího účtenku Contoso
MerchantPhoneNumber phoneNumber Uvedené telefonní číslo obchodníka 987-654-3210
MerchantAddress address Uvedená adresa obchodníka 123 Main St. Redmond, Washington 98052
Total number Celkový součet příjmu za celou transakci 14,34 Kč
TransactionDate date Datum vystavení potvrzení 6. června 2019
TransactionTime time Čas vydání účtenky 17:49
Subtotal number Mezisoučet příjmu, často před uplatněním daní 12,34 Kč
TotalTax number Daň z příjmu, často dph nebo ekvivalentní 2,00 USD
Tip number Tip zahrnutý kupujícím $1,00
Items array
Items.* object Extrahovaná položka řádku 0
Surface Pro 6
999,00 Kč
999,00 Kč
Items.*.TotalPrice number Celková cena řádkové položky 999,00 Kč
Items.*.Description string Popis položky Surface Pro 6
Items.*.Quantity number Množství každé položky 0
Items.*.Price number Individuální cena každé jednotky položky 999,00 Kč
Items.*.ProductCode string Kód produktu, číslo výrobku nebo skladová položka přidružená ke konkrétní položce řádku A123
Items.*.QuantityUnit string Jednotku množství každé položky
TaxDetails array
TaxDetails.* object Extrahovaná položka řádku 0
Surface Pro 6
999,00 Kč
999,00 Kč
TaxDetails.*.Amount currency Výše podrobností o dani 999,00 Kč

receipt.hotel

Pole Typ Popis Příklad
MerchantName string Název obchodníka vydávajícího účtenku Contoso
MerchantPhoneNumber phoneNumber Uvedené telefonní číslo obchodníka 987-654-310
MerchantAddress address Uvedená adresa obchodníka 123 Main St. Redmond, Washington 98052
Total number Celkový součet příjmu za celou transakci 14,34 Kč
ArrivalDate date Datum příjezdu 27Mar21
DepartureDate date Datum odjezdu 28Mar21
Currency string Měnu příjmových částek (ISO 4217) nebo "SMÍŠENÝ", pokud se najde více hodnot USD
MerchantAliases array
MerchantAliases.* string Alternativní název obchodníka Contoso (R)
Items array
Items.* object Extrahovaná položka řádku 0
Surface Pro 6
999,00 Kč
999,00 Kč
Items.*.TotalPrice number Celková cena řádkové položky 999,00 Kč
Items.*.Description string Popis položky Poplatek za pokoj
Items.*.Date date Datum položky 27Mar21
Items.*.Category string Kategorie položky Místnost

Průvodce migrací a rozhraní REST API verze 3.1

  • Postupujte podle našeho průvodce migrací Document Intelligence v3.1 a zjistěte, jak používat verzi v3.1 ve vašich aplikacích a pracovních postupech.

Další kroky

  • Zkuste zpracovat vlastní formuláře a dokumenty pomocí nástroje Document Intelligence Sample Labeling.

  • Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.