Model payStub funkce Document Intelligence

Článek
10/17/2024

Model payStub funkce Document Intelligence kombinuje výkonné funkce optického rozpoznávání znaků (OCR) s modely hlubokého učení, které analyzují a extrahují údaje o kompenzacích a příjmech z výplatových skluzů. Rozhraní API analyzuje dokumenty a soubory s informacemi souvisejícími s mzdami; extrahuje klíčové informace a vrátí strukturovanou reprezentaci dat JSON.

Funkce	version	ID modelu
model payStub	• v4.0:2024-07-31 (Preview)	`prebuilt-payStub.us`

Vyzkoušení extrakce dat s procedurou PayStub

Mzdové zástupné procedury jsou základní dokumenty vydané zaměstnavateli zaměstnancům, poskytování příjmů, odpočtů a čistých mzdových informací pro konkrétní výplatní období. Podívejte se, jak se data extrahují pomocí prebuilt-payStub.us modelu. Potřebujete následující zdroje informací:

Předplatné Azure – můžete si ho zdarma vytvořit.
Instance Document Intelligence na webu Azure Portal K vyzkoušení služby můžete použít cenovou úroveň Free (F0). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod.

Document Intelligence Studio

Na domovské stránce nástroje Document Intelligence Studio vyberte payStub.
Můžete analyzovat ukázkovou proceduru plateb nebo nahrát vlastní soubory.
Vyberte tlačítko Spustit analýzu a v případě potřeby nakonfigurujte možnosti Analyzovat:

Požadavky na vstup

Podporované formáty souborů:

Model	PDF	Obrázek: `JPEG/JPG`, `PNG`, `BMP`, `TIFF`, `HEIF`	systém Microsoft Office: Word (`DOCX`), Excel (`XLSX`), PowerPoint (`PPTX`), HTML
Čteno	✔	✔	✔
Rozložení	✔	✔	✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
Obecný dokument	✔	✔
Předpřipravený	✔	✔
Vlastní extrakce	✔	✔
Vlastní klasifikace	✔	✔	✔ (31. 7. 2024, 2024-02-29-preview)

Nejlepšíchvýsledkůch
U SOUBORŮ PDF a TIFF je možné zpracovat až 2 000 stránek (s předplatným úrovně Free se zpracuje pouze první dvě stránky).
Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a 4 MB pro bezplatnou úroveň (F0).
Rozměry obrázku musí být mezi 50 pixely x 50 pixelů a 10 000 pixelů x 10 000 pixelů.
Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.
Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá 8 bodě textu na 150 bodů na palec (DPI).
Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.
- Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a 1 GB pro neurální model.
- Pro trénování modelu vlastní klasifikace je 1 celková velikost trénovacích dat GB s maximálně 10 000 stránkami. Pro verzi 2024-07-31-preview a novější je 2 celková velikost trénovacích dat GB s maximálně 10 000 stránkami.

Podporované jazyky a národní prostředí

Úplný seznam podporovaných jazyků najdete na naší stránce podpory předem připravených jazyků modelu.

Extrakce polí

Podporovaná pole pro extrakci dokumentů najdete na stránce schématu modelu payStub v našem ukázkovém úložišti GitHubu.

Podporovaná národní prostředí

Prebuilt-payStub.us verze 2027-07-31-preview podporuje národní prostředí en-us.

Další kroky

Zkuste pomocí nástroje Document Intelligence Studio zpracovat vlastní formuláře a dokumenty .
Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.

Sdílet prostřednictvím