Model kontraktů Document Intelligence

Důležité

  • Verze Document Intelligence ve verzi Public Preview poskytují dřívější přístup k funkcím, které jsou aktivní ve vývoji.
  • Funkce, přístupy a procesy se můžou před obecnou dostupností (GA) změnit na základě zpětné vazby uživatelů.
  • Verze Public Preview klientských knihoven Document Intelligence ve výchozím nastavení je rest API verze 2024-02-29-preview.
  • Verze Public Preview 2024-02-29-preview je aktuálně dostupná jenom v následujících oblastech Azure:
  • USA – východ
  • USA – západ 2
  • Západní Evropa

Tento obsah se vztahuje na:Zaškrtnutív4.0 (Preview) | Předchozí verze:modrá značka zaškrtnutív3.1 (GA)

Tento obsah se vztahuje na:Zaškrtnutív3.1 (GA) | Nejnovější verze:nachová značka zaškrtnutív4.0 (Preview)

Model kontraktů Document Intelligence používá výkonné funkce optického rozpoznávání znaků (OCR) k analýze a extrakci klíčových polí a řádkových položek z vybrané skupiny důležitých entit kontraktu. Kontrakty můžou mít různé formáty a kvalitu, včetně obrázků zachycených telefonem, naskenovaných dokumentů a digitálních souborů PDF. Rozhraní API analyzuje text dokumentu; extrahuje klíčové informace, jako jsou strany, jurisdikce, ID smlouvy a titul; a vrátí strukturovanou reprezentaci dat JSON. Model v současné době podporuje formáty dokumentů v angličtině.

Automatizované zpracování kontraktů

Automatizované zpracování kontraktů je proces extrakce klíčových polí kontraktů z dokumentů. Proces analýzy kontraktů se historicky dosahuje ručně, a proto je velmi časově náročný. Přesná extrakce klíčových dat z kontraktů je obvykle první a jeden z nejdůležitějších kroků v procesu automatizace kontraktů.

Možnosti vývoje

Document Intelligence v4.0 (2024-02-02-29-preview) podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací ID modelu
Model kontraktů Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
• JavaScript SDK• JavaScript SDK
předem připravená smlouva

Document Intelligence v3.1 podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací ID modelu
Model kontraktů Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
• JavaScript SDK• JavaScript SDK
předem připravená smlouva

Document Intelligence v3.0 podporuje následující nástroje, aplikace a knihovny:

Funkce Zdroje informací ID modelu
Model kontraktů Document Intelligence Studio
REST API
C# SDK
Python SDK• Java SDK
• JavaScript SDK• JavaScript SDK
předem připravená smlouva

Požadavky na vstup

  • Nejlepšíchvýsledkůch

  • Podporované formáty souborů:

    Model PDF Obrázek:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    systém Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) a HTML
    Čteno
    Rozložení ✔ (2024-02-29-preview, 2023-10-31-preview)
    Obecný dokument
    Předpřipravený
    Vlastní extrakce
    Vlastní klasifikace ✔ (29. 2024. 2024)
  • U SOUBORŮ PDF a TIFF je možné zpracovat až 2000 stránek (s předplatným úrovně Free se zpracovávají pouze první dvě stránky).

  • Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a 4 MB pro bezplatnou úroveň (F0).

  • Rozměry obrázku musí být mezi 50 x 50 pixelů a 10 000 px x 10 000 pixelů.

  • Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.

  • Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá 8150 bodům na palec (DPI).

  • Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.

    • Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a 1G MB pro neurální model.

    • Pro trénování modelu vlastní klasifikace je 1GB celková velikost trénovacích dat s maximálně 10 000 stránkami.

Vyzkoušení extrakce dat dokumentu kontraktu

Podívejte se, jak se data, včetně informací o zákazníci, podrobností o dodavateli a řádkových položek, extrahují ze smluv. Potřebujete následující zdroje informací:

  • Předplatné Azure – můžete si ho zdarma vytvořit.

  • Instance Document Intelligence na webu Azure Portal K vyzkoušení služby můžete použít cenovou úroveň Free (F0). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod.

Snímek obrazovky s klíči a umístěním koncového bodu na webu Azure Portal

Document Intelligence Studio

  1. Na domovské stránce nástroje Document Intelligence Studio vyberte Daňové doklady.

  2. Můžete analyzovat ukázkové daňové doklady nebo nahrát vlastní soubory.

  3. Vyberte tlačítko Spustit analýzu a v případě potřeby nakonfigurujte možnosti Analyzovat:

    Snímek obrazovky s tlačítky Možnosti Spustit analýzu a Analýza v nástroji Document Intelligence Studio

Podporované jazyky a národní prostředí

Úplný seznam podporovaných jazyků najdete na stránce podpory jazyků – předem připravená stránka modelů .

Extrakce polí

Následuje pole extrahovaná ze kontraktu ve výstupní odpovědi JSON.

Name Typ Popis Příklad výstupu
Nadpis String Název smlouvy Servisní smlouva
ContractId String Název smlouvy AB12956
Strany Pole Seznam právních stran
Datum spuštění Datum Datum, kdy byla dohoda plně podepsána a odsouhlasena všemi stranami On this twenty-third day of February two thousand and twenty two
Datum vypršení platnosti Datum Datum ukončení smlouvy Jeden rok
Datum obnovení Datum Datum, kdy je třeba smlouvu prodloužit On this twenty-third day of February two thousand and twenty two
Jurisdikce Pole Seznam jurisdikcí

Páry klíč-hodnota kontraktu a extrahované řádkové položky jsou v documentResults části výstupu JSON.

Další kroky