Teilen über


Lohnabrechnungsmodell von Document Intelligence

Das Lohnabrechnungsmodell von Document Intelligence kombiniert leistungsstarke OCR-Funktionen (Optical Character Recognition, Optische Zeichenerkennung) mit Deep Learning-Modellen, um Vergütungs- und Einnahmedaten aus Lohnzetteln zu analysieren und zu extrahieren. Die API analysiert Dokumente und Dateien mit Informationen zu Lohnbuchhaltungen; extrahiert wichtige Informationen und gibt eine strukturierte JSON-Datendarstellung zurück.

Funktion version Modell-ID
Lohnbuchhaltungsmodell • v4.0:2024-07-31 (preview) prebuilt-payStub.us

Probieren Sie die Lohndatenextraktion

Lohnabrechnungen sind wesentliche Dokumente, die von Arbeitgebern an Arbeitnehmer ausgegeben werden, die Einnahmen, Abzüge und Nettolohninformationen für einen bestimmten Zahlungszeitraum bereitstellen. Erfahren Sie, wie Daten mithilfe des prebuilt-payStub.us-Modells extrahiert werden. Sie benötigen die folgenden Ressourcen:

  • Azure-Abonnement – Sie können ein kostenloses Abonnement erstellen

  • Eine Dokument Intelligenz-Instanz im Azure-Portal. Sie können den kostenlosen Tarif (F0) verwenden, um den Dienst auszuprobieren. Wählen Sie nach der Bereitstellung Ihrer Ressource Zu Ressource wechseln aus, um Ihren Schlüssel und Endpunkt abzurufen.

    Screenshot: Schlüssel und Endpunkt im Azure-Portal

Dokument Intelligenz Studio

  1. Wählen Sie auf der Startseite Document Intelligence Studio Lohnabrechnung aus.

  2. Sie können die Musterlohnabrechnung analysieren oder Ihre eigenen Dateien hochladen.

  3. Wählen Sie die Schaltfläche Analyse ausführen aus, und konfigurieren Sie bei Bedarf die Analyseoptionen:

Eingabeanforderungen

  • Unterstützte Dateiformate:

    Modell PDF Abbildung:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Lesen Sie
    Layout ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Allgemeines Dokument
    Vordefiniert
    Benutzerdefinierte Extraktion
    Benutzerdefinierte Klassifizierung ✔ (2024-07-31-preview, 2024-02-29-preview)
  • Die besten Ergebnisse erzielen Sie, wenn Sie pro Dokument ein deutliches Foto oder einen hochwertigen Scan bereitstellen.

  • In den Formaten PDF und TIFF können bis zu 2,000 Seiten verarbeitet werden (bei einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet).

  • Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für den kostenpflichtigen Tarif (S0) und 4 MB für den kostenlosen Tarif (F0).

  • Die Bildgröße muss zwischen 50 × 50 Pixel und 10.000 × 10.000 Pixel liegen.

  • Wenn Ihre PDFs kennwortgeschützt sind, müssen Sie die Sperre vor dem Senden entfernen.

  • Die Mindesthöhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 × 768 Pixel. Diese Abmessung entspricht etwa einem 8-Punkttext bei 150 Punkten pro Zoll (Dots Per Inch, DPI).

  • Die maximale Anzahl Seiten für Trainingsdaten beträgt beim benutzerdefinierten Modelltraining 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neuronale Modell.

    • Für das Training benutzerdefinierter Extraktionsmodelle beträgt die Gesamtgröße der Trainingsdaten 50 MB für das Vorlagenmodell und 1 GB für das neuronale Modell.

    • Für das Training benutzerdefinierter Klassifizierungsmodelle beträgt die Gesamtgröße der Trainingsdaten 1 GB bei maximal 10.000 Seiten. Für 2024-07-31-preview und höher beträgt die Gesamtgröße der Trainingsdaten 2 GB bei maximal 10.000 Seiten.

Unterstützte Sprachen und Regionen

Eine vollständige Liste der unterstützten Sprachen finden Sie unter Sprachunterstützung – Benutzerdefinierte Modelle.

Feldextraktionen

Name Typ BESCHREIBUNG Standardisierte Ausgabe
EmployeeAddress address Adresse des Arbeitnehmers 123 Maple Street, Springfield, IL, 62701
EmployeeName string Name des Arbeitnehmers John A. Doe
EmployeeSSN string Sozialversicherungsnummer des Arbeitnehmers 123-45-6789
EmployerAddress address Adresse des Arbeitgebers 456 Oak Avenue, Metropolis, NY, 10101
EmployerName string Eingetragener Name des Arbeitgebers Contoso Corporation
PayDate date Datum der Lohnzahlung 26. Februar 2020
PayPeriodStartDate date Startdatum des Zahlungszeitraums 19. Februar 2020
PayPeriodEndDate date Enddatum des Zahlungszeitraums 25. Februar 2020
CurrentPeriodGrossPay number Bruttozahlung des aktuellen Zeitraums $744,10
YearToDateGrossPay number Jahresbeginn bis heute: Bruttozahlung $2744,10
CurrentPeriodTaxes number Steuern des aktuellen Zeitraums $410,10
YearToDateTaxes number Jahresbeginn bis heute: Steuern $855,90
CurrentPeriodDeductions number Abzüge der aktuellen Periode $410,10
YearToDateDeductions number Jahresbeginn bis heute: Abzüge $855,90
CurrentPeriodNetPay number Nettozahlung des aktuellen Zeitraums $744,10
YearToDateNetPay number Jahresbeginn bis heute: Nettozahlung $2744,10

Unterstützte Gebietsschemas

Die prebuilt-payStub.us-Version 2027-07-31-preview unterstützt das Gebietsschema en-us.

Nächste Schritte