Document Intelligence payStub modell

Cikk
10/17/2024

A Document Intelligence payStub modell a hatékony optikai karakterfelismerési (OCR) képességeket mélytanulási modellekkel kombinálva elemzi és kinyeri a bérszelvényekből származó kompenzációs és bevételi adatokat. Az API bérszámfejtéssel kapcsolatos információkkal elemzi a dokumentumokat és fájlokat; kinyeri a kulcsinformációkat, és strukturált JSON-adatábrázolást ad vissza.

Szolgáltatás	Verzió	Modellazonosító
payStub modell	• v4.0:2024-07-31 (előzetes verzió)	`prebuilt-payStub.us`

PayStub-adatkinyerés kipróbálása

A fizetéses csonkok alapvető dokumentumok, amelyeket a munkáltatók bocsátanak ki a munkavállalók számára, amelyek egy adott fizetési időszakra vonatkozóan nyújtanak jövedelmet, levonásokat és nettó fizetési információkat. Megtudhatja, hogyan nyeri ki az adatokat a modell használatával prebuilt-payStub.us . A következő erőforrásokra van szüksége:

Azure-előfizetés – ingyenesen létrehozhat egyet
Dokumentumintelligencia-példány az Azure Portalon. A szolgáltatás kipróbálásához használhatja az ingyenes tarifacsomagot (F0). Az erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget a kulcs és a végpont lekéréséhez.

Document Intelligence Studio

A Document Intelligence Studio kezdőlapján válassza a payStub lehetőséget.
Elemezheti a mintául szolgáló fizetési csonkot, vagy feltöltheti a saját fájljait.
Válassza a Futtatás elemzés gombot, és szükség esetén konfigurálja az Elemzési beállításokat :

Bemeneti követelmények

Támogatott fájlformátumok:

Modell	PDF	Kép: `JPEG/JPG`, `PNG`, `BMP`, `TIFFHEIF`	Microsoft Office: Word (`DOCX`), Excel (`XLSX`), PowerPoint (`PPTX`), HTML
Olvasás	✔	✔	✔
Elrendezés	✔	✔	✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
Általános dokumentum	✔	✔
Előre összeállított	✔	✔
Egyéni kinyerés	✔	✔
Egyéni besorolás	✔	✔	✔ (2024-07-31-preview, 2024-02-29-preview)

A legjobb eredmény érdekében dokumentumonként egy tiszta fényképet vagy kiváló minőségű vizsgálatot biztosít.
PDF és TIFF esetén legfeljebb 2000 oldal dolgozható fel (ingyenes szintű előfizetéssel csak az első két oldal dolgozható fel).
A dokumentumok elemzéséhez használt fájlméret 500 MB a fizetős (S0) szint, az 4 ingyenes (F0) szint esetén pedig MB.
A képméreteknek 50 képpont x 50 képpont és 10 000 képpont x 10 000 képpont között kell lenniük.
Ha a PDF-eket jelszó védi, akkor beküldés előtt el kell távolítania a védelmet.
A kinyerni kívánt szöveg minimális magassága 12 képpont egy 1024 x 768 képpontos képhez. Ez a dimenzió körülbelül 8 150 pont/hüvelyk (DPI) pontszövegnek felel meg.
Egyéni modell betanítása esetén a betanítási adatok oldalainak maximális száma az egyéni sablonmodell esetében 500, az egyéni neurális modell esetében pedig 50 000.
- Egyéni extrakciós modell betanítása esetén a betanítási adatok teljes mérete 50 MB a sablonmodellhez, a neurális modellhez pedig 1 GB.
- Egyéni besorolási modell betanítása esetén a betanítási adatok 1 teljes mérete GB, legfeljebb 10 000 oldal. A 2024-07-31-es és újabb verziókban a betanítási adatok 2 teljes mérete GB, legfeljebb 10 000 oldal.

Támogatott nyelvek és területi beállítások

A támogatott nyelvek teljes listáját az előre összeállított modell nyelvtámogatási oldalán találja.

Mezőkinyerések

A támogatott dokumentumkinyerési mezőkért tekintse meg a PayStub-modell sémalapját a GitHub-mintaadattárban.

Támogatott területi beállítások

A prebuilt-payStub.us 2027-07-31 előzetes verziója támogatja az en-us területi beállításokat.

Következő lépések

Saját űrlapok és dokumentumok feldolgozása a Document Intelligence Studióval
Végezze el a Dokumentumintelligencia rövid útmutatóját , és kezdje el létrehozni egy dokumentumfeldolgozó alkalmazást a választott fejlesztési nyelven.

Megosztás a következőn keresztül: