Model kontraktů Document Intelligence
Důležité
- Verze Document Intelligence ve verzi Public Preview poskytují dřívější přístup k funkcím, které jsou aktivní ve vývoji.
- Funkce, přístupy a procesy se můžou před obecnou dostupností (GA) změnit na základě zpětné vazby uživatelů.
- Verze Public Preview klientských knihoven Document Intelligence ve výchozím nastavení je rest API verze 2024-02-29-preview.
- Verze Public Preview 2024-02-29-preview je aktuálně dostupná jenom v následujících oblastech Azure:
- USA – východ
- USA – západ 2
- Západní Evropa
Tento obsah se vztahuje na: v4.0 (Preview) | Předchozí verze: v3.1 (GA)
Tento obsah se vztahuje na: v3.1 (GA) | Nejnovější verze: v4.0 (Preview)
Model kontraktů Document Intelligence používá výkonné funkce optického rozpoznávání znaků (OCR) k analýze a extrakci klíčových polí a řádkových položek z vybrané skupiny důležitých entit kontraktu. Kontrakty můžou mít různé formáty a kvalitu, včetně obrázků zachycených telefonem, naskenovaných dokumentů a digitálních souborů PDF. Rozhraní API analyzuje text dokumentu; extrahuje klíčové informace, jako jsou strany, jurisdikce, ID smlouvy a titul; a vrátí strukturovanou reprezentaci dat JSON. Model v současné době podporuje formáty dokumentů v angličtině.
Automatizované zpracování kontraktů
Automatizované zpracování kontraktů je proces extrakce klíčových polí kontraktů z dokumentů. Proces analýzy kontraktů se historicky dosahuje ručně, a proto je velmi časově náročný. Přesná extrakce klíčových dat z kontraktů je obvykle první a jeden z nejdůležitějších kroků v procesu automatizace kontraktů.
Možnosti vývoje
Document Intelligence v4.0 (2024-02-02-29-preview) podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací | ID modelu |
---|---|---|
Model kontraktů | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK• JavaScript SDK |
předem připravená smlouva |
Document Intelligence v3.1 podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací | ID modelu |
---|---|---|
Model kontraktů | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK• JavaScript SDK |
předem připravená smlouva |
Document Intelligence v3.0 podporuje následující nástroje, aplikace a knihovny:
Funkce | Zdroje informací | ID modelu |
---|---|---|
Model kontraktů | • Document Intelligence Studio • REST API • C# SDK • Python SDK• Java SDK • JavaScript SDK• JavaScript SDK |
předem připravená smlouva |
Požadavky na vstup
Nejlepšíchvýsledkůch
Podporované formáty souborů:
Model PDF Obrázek:
JPEG/JPG, PNG, BMP, TIFF, HEIFsystém Microsoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) a HTMLČteno ✔ ✔ ✔ Rozložení ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Obecný dokument ✔ ✔ Předpřipravený ✔ ✔ Vlastní extrakce ✔ ✔ Vlastní klasifikace ✔ ✔ ✔ (29. 2024. 2024) U SOUBORŮ PDF a TIFF je možné zpracovat až 2000 stránek (s předplatným úrovně Free se zpracovávají pouze první dvě stránky).
Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a 4 MB pro bezplatnou úroveň (F0).
Rozměry obrázku musí být mezi 50 x 50 pixelů a 10 000 px x 10 000 pixelů.
Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.
Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá
8
150 bodům na palec (DPI).Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.
Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a 1G MB pro neurální model.
Pro trénování modelu vlastní klasifikace je
1GB
celková velikost trénovacích dat s maximálně 10 000 stránkami.
Vyzkoušení extrakce dat dokumentu kontraktu
Podívejte se, jak se data, včetně informací o zákazníci, podrobností o dodavateli a řádkových položek, extrahují ze smluv. Potřebujete následující zdroje informací:
Předplatné Azure – můžete si ho zdarma vytvořit.
Instance Document Intelligence na webu Azure Portal K vyzkoušení služby můžete použít cenovou úroveň Free (
F0
). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod.
Document Intelligence Studio
Na domovské stránce nástroje Document Intelligence Studio vyberte Daňové doklady.
Můžete analyzovat ukázkové daňové doklady nebo nahrát vlastní soubory.
Vyberte tlačítko Spustit analýzu a v případě potřeby nakonfigurujte možnosti Analyzovat:
Podporované jazyky a národní prostředí
Úplný seznam podporovaných jazyků najdete na stránce podpory jazyků – předem připravená stránka modelů .
Extrakce polí
Následuje pole extrahovaná ze kontraktu ve výstupní odpovědi JSON.
Name | Typ | Popis | Příklad výstupu |
---|---|---|---|
Nadpis | String | Název smlouvy | Servisní smlouva |
ContractId | String | Název smlouvy | AB12956 |
Strany | Pole | Seznam právních stran | |
Datum spuštění | Datum | Datum, kdy byla dohoda plně podepsána a odsouhlasena všemi stranami | On this twenty-third day of February two thousand and twenty two |
Datum vypršení platnosti | Datum | Datum ukončení smlouvy | Jeden rok |
Datum obnovení | Datum | Datum, kdy je třeba smlouvu prodloužit | On this twenty-third day of February two thousand and twenty two |
Jurisdikce | Pole | Seznam jurisdikcí |
Páry klíč-hodnota kontraktu a extrahované řádkové položky jsou v documentResults
části výstupu JSON.
Další kroky
Zkuste pomocí nástroje Document Intelligence Studio zpracovat vlastní formuláře a dokumenty.
Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro