Megosztás a következőn keresztül:


Document Intelligence payStub modell

A Document Intelligence payStub modell a hatékony optikai karakterfelismerési (OCR) képességeket mélytanulási modellekkel kombinálva elemzi és kinyeri a bérszelvényekből származó kompenzációs és bevételi adatokat. Az API bérszámfejtéssel kapcsolatos információkkal elemzi a dokumentumokat és fájlokat; kinyeri a kulcsinformációkat, és strukturált JSON-adatábrázolást ad vissza.

Szolgáltatás Verzió Modellazonosító
payStub modell • v4.0:2024-07-31 (előzetes verzió) prebuilt-payStub.us

PayStub-adatkinyerés kipróbálása

A fizetéses csonkok alapvető dokumentumok, amelyeket a munkáltatók bocsátanak ki a munkavállalók számára, amelyek egy adott fizetési időszakra vonatkozóan nyújtanak jövedelmet, levonásokat és nettó fizetési információkat. Megtudhatja, hogyan nyeri ki az adatokat a modell használatával prebuilt-payStub.us . A következő erőforrásokra van szüksége:

  • Azure-előfizetés – ingyenesen létrehozhat egyet

  • Dokumentumintelligencia-példány az Azure Portalon. A szolgáltatás kipróbálásához használhatja az ingyenes tarifacsomagot (F0). Az erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget a kulcs és a végpont lekéréséhez.

    Képernyőkép a kulcsok és a végpontok helyéről az Azure Portalon.

Document Intelligence Studio

  1. A Document Intelligence Studio kezdőlapján válassza a payStub lehetőséget.

  2. Elemezheti a mintául szolgáló fizetési csonkot, vagy feltöltheti a saját fájljait.

  3. Válassza a Futtatás elemzés gombot, és szükség esetén konfigurálja az Elemzési beállításokat :

Bemeneti követelmények

  • Támogatott fájlformátumok:

    Modell PDF Kép:
    JPEG/JPG, PNG, BMP, TIFFHEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Olvasás
    Elrendezés ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Általános dokumentum
    Előre összeállított
    Egyéni kinyerés
    Egyéni besorolás ✔ (2024-07-31-preview, 2024-02-29-preview)
  • A legjobb eredmény érdekében dokumentumonként egy tiszta fényképet vagy kiváló minőségű vizsgálatot biztosít.

  • PDF és TIFF esetén legfeljebb 2000 oldal dolgozható fel (ingyenes szintű előfizetéssel csak az első két oldal dolgozható fel).

  • A dokumentumok elemzéséhez használt fájlméret 500 MB a fizetős (S0) szint, az 4 ingyenes (F0) szint esetén pedig MB.

  • A képméreteknek 50 képpont x 50 képpont és 10 000 képpont x 10 000 képpont között kell lenniük.

  • Ha a PDF-eket jelszó védi, akkor beküldés előtt el kell távolítania a védelmet.

  • A kinyerni kívánt szöveg minimális magassága 12 képpont egy 1024 x 768 képpontos képhez. Ez a dimenzió körülbelül 8 150 pont/hüvelyk (DPI) pontszövegnek felel meg.

  • Egyéni modell betanítása esetén a betanítási adatok oldalainak maximális száma az egyéni sablonmodell esetében 500, az egyéni neurális modell esetében pedig 50 000.

    • Egyéni extrakciós modell betanítása esetén a betanítási adatok teljes mérete 50 MB a sablonmodellhez, a neurális modellhez pedig 1 GB.

    • Egyéni besorolási modell betanítása esetén a betanítási adatok 1 teljes mérete GB, legfeljebb 10 000 oldal. A 2024-07-31-es és újabb verziókban a betanítási adatok 2 teljes mérete GB, legfeljebb 10 000 oldal.

Támogatott nyelvek és területi beállítások

A támogatott nyelvek teljes listáját az előre összeállított modell nyelvtámogatási oldalán találja.

Mezőkinyerések

A támogatott dokumentumkinyerési mezőkért tekintse meg a PayStub-modell sémalapját a GitHub-mintaadattárban.

Támogatott területi beállítások

A prebuilt-payStub.us 2027-07-31 előzetes verziója támogatja az en-us területi beállításokat.

Következő lépések