Sdílet prostřednictvím


Model payStub funkce Document Intelligence

Model payStub funkce Document Intelligence kombinuje výkonné funkce optického rozpoznávání znaků (OCR) s modely hlubokého učení, které analyzují a extrahují údaje o kompenzacích a příjmech z výplatových skluzů. Rozhraní API analyzuje dokumenty a soubory s informacemi souvisejícími s mzdami; extrahuje klíčové informace a vrátí strukturovanou reprezentaci dat JSON.

Funkce version ID modelu
model payStub • v4.0:2024-07-31 (Preview) prebuilt-payStub.us

Vyzkoušení extrakce dat s procedurou PayStub

Mzdové zástupné procedury jsou základní dokumenty vydané zaměstnavateli zaměstnancům, poskytování příjmů, odpočtů a čistých mzdových informací pro konkrétní výplatní období. Podívejte se, jak se data extrahují pomocí prebuilt-payStub.us modelu. Potřebujete následující zdroje informací:

  • Předplatné Azure – můžete si ho zdarma vytvořit.

  • Instance Document Intelligence na webu Azure Portal K vyzkoušení služby můžete použít cenovou úroveň Free (F0). Po nasazení prostředku vyberte Přejít k prostředku a získejte klíč a koncový bod.

    Snímek obrazovky s klíči a umístěním koncového bodu na webu Azure Portal

Document Intelligence Studio

  1. Na domovské stránce nástroje Document Intelligence Studio vyberte payStub.

  2. Můžete analyzovat ukázkovou proceduru plateb nebo nahrát vlastní soubory.

  3. Vyberte tlačítko Spustit analýzu a v případě potřeby nakonfigurujte možnosti Analyzovat:

Požadavky na vstup

  • Podporované formáty souborů:

    Model PDF Obrázek:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    systém Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Čteno
    Rozložení ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Obecný dokument
    Předpřipravený
    Vlastní extrakce
    Vlastní klasifikace ✔ (31. 7. 2024, 2024-02-29-preview)
  • Nejlepšíchvýsledkůch

  • U SOUBORŮ PDF a TIFF je možné zpracovat až 2 000 stránek (s předplatným úrovně Free se zpracuje pouze první dvě stránky).

  • Velikost souboru pro analýzu dokumentů je 500 MB pro placenou úroveň (S0) a 4 MB pro bezplatnou úroveň (F0).

  • Rozměry obrázku musí být mezi 50 pixely x 50 pixelů a 10 000 pixelů x 10 000 pixelů.

  • Pokud jsou soubory PDF uzamčené heslem, musíte před odesláním toto uzamčení odebrat.

  • Minimální výška extrahovaného textu je 12 pixelů pro obrázek o velikosti 1024 x 768 pixelů. Tato dimenze odpovídá 8 bodě textu na 150 bodů na palec (DPI).

  • Pro trénování vlastního modelu je maximální počet stránek pro trénovací data 500 pro vlastní model šablony a 50 000 pro vlastní neurální model.

    • Pro trénování vlastního modelu extrakce je celková velikost trénovacích dat 50 MB pro model šablony a 1 GB pro neurální model.

    • Pro trénování modelu vlastní klasifikace je 1 celková velikost trénovacích dat GB s maximálně 10 000 stránkami. Pro verzi 2024-07-31-preview a novější je 2 celková velikost trénovacích dat GB s maximálně 10 000 stránkami.

Podporované jazyky a národní prostředí

Úplný seznam podporovaných jazyků najdete na naší stránce podpory předem připravených jazyků modelu.

Extrakce polí

Podporovaná pole pro extrakci dokumentů najdete na stránce schématu modelu payStub v našem ukázkovém úložišti GitHubu.

Podporovaná národní prostředí

Prebuilt-payStub.us verze 2027-07-31-preview podporuje národní prostředí en-us.

Další kroky

  • Zkuste pomocí nástroje Document Intelligence Studio zpracovat vlastní formuláře a dokumenty .

  • Dokončete rychlý start s funkcí Document Intelligence a začněte vytvářet aplikaci pro zpracování dokumentů ve zvoleném vývojovém jazyce.