Sdílet prostřednictvím


Model potvrzení o dokumentech

Důležité

  • Verze Document Intelligence ve verzi Public Preview poskytují dřívější přístup k funkcím, které jsou aktivní ve vývoji. Funkce, přístupy a procesy se můžou před obecnou dostupností (GA) změnit na základě zpětné vazby uživatelů.
  • Verze Public Preview klientských knihoven Document Intelligence je výchozí pro rozhraní REST API verze 2024-07-31-preview.
  • Verze Public Preview 2024-07-31-preview je aktuálně dostupná jenom v následujících oblastech Azure. Všimněte si, že vlastní model generování (extrakce polí dokumentu) v AI Studiu je k dispozici pouze v oblasti USA – středosever:
    • USA – východ
    • USA – západ 2
    • Západní Evropa
    • USA – středosever

Tento obsah se vztahuje na: Zaškrtnutí v4.0 (Preview) | Předchozí verze: modrá značka zaškrtnutí v3.1 (GA) v3.0 (GA) modrá značka zaškrtnutí modrá značka zaškrtnutí v2.1 (GA)

Tento obsah se vztahuje na: Zaškrtnutí v3.1 (GA) | Nejnovější verze: nachová značka zaškrtnutí v4.0 (Preview) | Předchozí verze: modrá značka zaškrtnutí v3.0modrá značka zaškrtnutí v2.1

Tento obsah se vztahuje na:Zaškrtnutí v3.0 (GA) | Nejnovější verze: nachová značka zaškrtnutí v4.0 (Preview) nachová značka zaškrtnutív3.1 | Předchozí verze: modrá značka zaškrtnutí v2.1

Tento obsah se vztahuje na: Zaškrtnutí v2.1 | Nejnovější verze: modrá značka zaškrtnutí v4.0 (Preview)

Model účtenky Document Intelligence kombinuje výkonné funkce optického rozpoznávání znaků (OCR) s modely hlubokého učení, které analyzují a extrahují klíčové informace z prodejních účtenek. Účtenky můžou mít různé formáty a kvalitu včetně tištěných a rukou psaných účtenek. Rozhraní API extrahuje klíčové informace, jako je název obchodníka, telefonní číslo obchodníka, datum transakce, daň a celkový součet transakcí a vrací strukturovaná data JSON.

Podporované typy účtenek:

  • Tepelný
  • Platební karta
  • Gas
  • Parkoviště
  • Hotel
  • Doprava
  • Komunikace
  • Zábava
  • Let
  • Školení
  • Lékárna /Lékařské

Extrakce údajů o účtech

Digitalizace účtenek zahrnuje transformaci různých typů účtenek, včetně naskenovaných, fotografovaných a tištěných kopií, do digitálního formátu pro zjednodušené zpracování podřízeného procesu. Mezi příklady patří správa výdajů, analýza chování spotřebitelů, automatizace daní atd. Použití technologie Document Intelligence s technologií OCR (Optické rozpoznávání znaků) může extrahovat a interpretovat data z těchto různých formátů účtenek. Zpracování funkce Document Intelligence zjednodušuje proces převodu, ale také výrazně zkracuje čas a úsilí, což usnadňuje efektivní správu dat a načítání.

Ukázkový příjem zpracovaný pomocí nástroje Document Intelligence Studio:

Snímek obrazovky s ukázkovým účtem zpracovaným v nástroji Document Intelligence Studio

Ukázková účtenka zpracována pomocí nástroje Popisování ukázek funkce Document Intelligence:

Snímek obrazovky s ukázkovým potvrzením zpracovaným pomocí nástroje Pro popisování vzorového formuláře

Možnosti vývoje

Document Intelligence v4.0 (2024-07-07-31-preview) podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací ID modelu
Model účtenek Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
• JavaScript SDK• JavaScript SDK
předem připravená potvrzení

Document Intelligence v3.1 podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací ID modelu
Model účtenek Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
• JavaScript SDK• JavaScript SDK
předem připravená potvrzení

Document Intelligence v3.0 podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací ID modelu
Model účtenek Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
• JavaScript SDK• JavaScript SDK
předem připravená potvrzení

Document Intelligence v2.1 podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací
Model účtenek Nástroj pro
popisování document intelligence• REST API
sada SDK
klientské knihovny• Kontejner Document Intelligence Dockeru

Požadavky na vstup

  • Podporované formáty souborů:

    Model PDF Obrázek:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    systém Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Čteno
    Rozložení ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Obecný dokument
    Předpřipravený
    Vlastní extrakce
    Vlastní klasifikace ✔ (31. 7. 2024, 2024-02-29-preview)
  • Nejlepšíchvýsledkůch

  • U SOUBORŮ PDF a TIFF je možné zpracovat až 2 000 stránek (s předplatným úrovně Free se zpracuje pouze první dvě stránky).

  • Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a 4 MB pro bezplatnou úroveň (F0).

  • Rozměry obrázku musí být mezi 50 pixely x 50 pixelů a 10 000 pixelů x 10 000 pixelů.

  • Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.

  • Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá 8 bodě textu na 150 bodů na palec (DPI).

  • Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.

    • Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a 1 GB pro neurální model.

    • Pro trénování modelu vlastní klasifikace je 1 celková velikost trénovacích dat GB s maximálně 10 000 stránkami. Pro verzi 2024-07-31-preview a novější je 2 celková velikost trénovacích dat GB s maximálně 10 000 stránkami.

  • Podporované formáty souborů: JPEG, PNG, PDF a TIFF.
  • Podporovaný příspěvek na stránky pro PDF a TIFF: Funkce Document Intelligence může zpracovat až 2 000 stránek pro předplatitele standardní vrstvy nebo pouze první dvě stránky pro předplatitele úrovně Free.
  • Podporovaná velikost souboru: menší než 50 MB; minimální pixely 50 x 50 px; maximálně 10 000 × 10 000 pixelů.

Extrakce dat modelu účtenek

Podívejte se, jak funkce Document Intelligence extrahuje data, včetně času a data transakcí, informací o obchodních údajích a součtů částky z účtenek. Potřebujete následující zdroje informací:

  • Předplatné Azure – můžete si ho zdarma vytvořit.

  • Instance Document Intelligence na webu Azure Portal K vyzkoušení služby můžete použít cenovou úroveň Free (F0). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod.

Snímek obrazovky s klíči a umístěním koncového bodu na webu Azure Portal

Poznámka:

Document Intelligence Studio je k dispozici s rozhraními API v3.1 a v3.0 a novějšími verzemi.

  1. Na domovské stránce nástroje Document Intelligence Studio vyberte Potvrzení.

  2. Můžete analyzovat ukázkové potvrzení nebo nahrát vlastní soubory.

  3. Vyberte tlačítko Spustit analýzu a v případě potřeby nakonfigurujte možnosti Analyzovat:

    Snímek obrazovky s tlačítky Možnosti Spustit analýzu a Analýza v nástroji Document Intelligence Studio

Nástroj Document Intelligence Sample Labeling

  1. Přejděte k nástroji Ukázka funkce Document Intelligence.

  2. Na domovské stránce ukázkového nástroje vyberte k získání dlaždice s daty předem vytvořený model.

    Snímek obrazovky s procesem analýzy výsledků modelu rozložení

  3. V rozevírací nabídce vyberte typ formuláře, který chcete analyzovat.

  4. Vyberte adresu URL souboru, který chcete analyzovat, z následujících možností:

  5. V poli Zdroj vyberte adresu URL z rozevírací nabídky, vložte vybranou adresu URL a vyberte tlačítko Načíst.

    Snímek obrazovky s rozevírací nabídkou umístění zdroje

  6. Do pole koncový bod služby Document Intelligence vložte koncový bod, který jste získali s předplatným Document Intelligence.

  7. Do pole s klíčem vložte klíč, který jste získali z prostředku Document Intelligence.

    Snímek obrazovky s rozevírací nabídkou select-form-type

  8. Vyberte Spustit analýzu. Nástroj Popisování ukázek funkce Document Intelligence volá předem připravené rozhraní API pro analýzu a analyzuje dokument.

  9. Prohlédněte si výsledky – prohlédněte si páry klíč-hodnota extrahované, řádkové položky, zvýrazněný text extrahovaný a zjištěné tabulky.

    Snímek obrazovky s operací analýzy výsledků modelu rozložení

Poznámka:

Nástroj Sample Labeling nepodporuje formát souboru BMP. Jedná se o omezení nástroje, nikoli služby Document Intelligence.

Podporované jazyky a národní prostředí

Úplný seznam podporovaných jazyků najdete na naší stránce podpory předem připravených modelů.

Extrakce polí

Name Typ Popis Standardizovaný výstup
ReceiptType String Typ potvrzení o prodeji Rozepsaný
MerchantName String Název obchodníka vydávajícího účtenku
MerchantPhoneNumber phoneNumber Uvedené telefonní číslo obchodníka +1 xxx xxx xxxx
MerchantAddress String Uvedená adresa obchodníka
TransactionDate Datum Datum vystavení potvrzení yyyy-mm-dd
TransactionTime Čas Čas vydání účtenky hh-mm-ss (24 hodin)
Celkem Číslo (USD) Celkový součet příjmu za celou transakci Dvou desetinná čárka s plovoucí desetinnou čárkou
Dílčí součet Číslo (USD) Mezisoučet příjmu, často před uplatněním daní Dvou desetinná čárka s plovoucí desetinnou čárkou
Daň Číslo (USD) Celková daň z příjmu (často daň z prodeje nebo ekvivalent). Přejmenováno na TotalTax ve verzi 2022-06-30. Dvou desetinná čárka s plovoucí desetinnou čárkou
Tip Číslo (USD) Tip zahrnutý kupujícím Dvou desetinná čárka s plovoucí desetinnou čárkou
Items Pole řetězců Extrahované řádkové položky s názvem, množstvím, jednotkovou cenou a extrahovanou celkovou cenou
Název String Popis položky Přejmenováno na Popis ve verzi 2022-06-30.
Množství Počet Množství každé položky Dvou desetinná čárka s plovoucí desetinnou čárkou
Cena Počet Individuální cena každé jednotky položky Dvou desetinná čárka s plovoucí desetinnou čárkou
TotalPrice Počet Celková cena řádkové položky Dvou desetinná čárka s plovoucí desetinnou čárkou

Podporovaná pole pro extrakci dokumentů najdete na stránce schématu modelu účtenek v našem ukázkovém úložišti GitHubu.

Průvodce migrací a rozhraní REST API verze 3.1

  • Postupujte podle našeho průvodce migrací Document Intelligence v3.1 a zjistěte, jak používat verzi v3.1 ve vašich aplikacích a pracovních postupech.

Další kroky

  • Zkuste zpracovat vlastní formuláře a dokumenty pomocí nástroje Document Intelligence Sample Labeling.

  • Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.