Teilen über


Dokument Intelligenz-Modell für Kontoauszüge

Das Kontoauszugsmodell von Dokument Intelligenz kombiniert leistungsstarke OCR (Optical Character Recognition)-Funktionen mit Deep Learning-Modellen, um Daten aus amerikanischen Kontoauszügen zu analysieren und zu extrahieren. Die API analysiert gedruckte Kontoauszüge, extrahiert wichtige Informationen wie Kontonummer, Bankdetails, Kontodetails, Transaktionsdetails und Gebühren, und gibt eine strukturierte JSON-Datendarstellung zurück.

Funktion version Modell-ID
Kontoauszugsmodell • v4.0:2024-07-31 (preview) prebuilt-bankStatement.us

Datenextraktion von Kontoauszugsdaten

Ein Kontoauszug hilft, die Aktivitäten des Kontos während eines bestimmten Zeitraums zu überprüfen. Es handelt sich um einen offiziellen Auszug, der bei der Aufdeckung von Betrug, der Verfolgung von Ausgaben, Buchungsfehlern und der Aufzeichnung der Aktivitäten des Zeitraums hilft. Erfahren Sie, wie die Daten mithilfe des prebuilt-bankStatement.us-Modells extrahiert werden. Sie benötigen die folgenden Ressourcen:

  • Azure-Abonnement – Sie können ein kostenloses Abonnement erstellen

  • Eine Dokument Intelligenz-Instanz im Azure-Portal. Sie können den kostenlosen Tarif (F0) verwenden, um den Dienst auszuprobieren. Wählen Sie nach der Bereitstellung Ihrer Ressource Zu Ressource wechseln aus, um Ihren Schlüssel und Endpunkt abzurufen.

    Screenshot: Schlüssel und Endpunkt im Azure-Portal

Dokument Intelligenz Studio

  1. Wählen Sie auf der Startseite von Dokument Intelligenz Studio die Option Kontoauszüge aus.

  2. Sie können den Beispielkontoauszug analysieren oder Ihre eigenen Dateien hochladen.

  3. Wählen Sie die Schaltfläche Analyse ausführen aus, und konfigurieren Sie bei Bedarf die Analyseoptionen:

    Screenshot der Schaltflächen „Analyse ausführen“ und „Analyseoptionen“ im Document Intelligence Studio.

Eingabeanforderungen

  • Unterstützte Dateiformate:

    Modell PDF Abbildung:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
    Lesen Sie
    Layout ✔ (2024-07-31-preview, 2024-02-29-preview, 2023-10-31-preview)
    Allgemeines Dokument
    Vordefiniert
    Benutzerdefinierte Extraktion
    Benutzerdefinierte Klassifizierung ✔ (2024-07-31-preview, 2024-02-29-preview)
  • Die besten Ergebnisse erzielen Sie, wenn Sie pro Dokument ein deutliches Foto oder einen hochwertigen Scan bereitstellen.

  • In den Formaten PDF und TIFF können bis zu 2,000 Seiten verarbeitet werden (bei einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet).

  • Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für den kostenpflichtigen Tarif (S0) und 4 MB für den kostenlosen Tarif (F0).

  • Die Bildgröße muss zwischen 50 × 50 Pixel und 10.000 × 10.000 Pixel liegen.

  • Wenn Ihre PDFs kennwortgeschützt sind, müssen Sie die Sperre vor dem Senden entfernen.

  • Die Mindesthöhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 × 768 Pixel. Diese Abmessung entspricht etwa einem 8-Punkttext bei 150 Punkten pro Zoll (Dots Per Inch, DPI).

  • Die maximale Anzahl Seiten für Trainingsdaten beträgt beim benutzerdefinierten Modelltraining 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neuronale Modell.

    • Für das Training benutzerdefinierter Extraktionsmodelle beträgt die Gesamtgröße der Trainingsdaten 50 MB für das Vorlagenmodell und 1 GB für das neuronale Modell.

    • Für das Training benutzerdefinierter Klassifizierungsmodelle beträgt die Gesamtgröße der Trainingsdaten 1 GB bei maximal 10.000 Seiten. Für 2024-07-31-preview und höher beträgt die Gesamtgröße der Trainingsdaten 2 GB bei maximal 10.000 Seiten.

Unterstützte Sprachen und Regionen

Eine vollständige Liste der unterstützten Sprachen finden Sie unter Sprachunterstützung – Benutzerdefinierte Modelle.

Feldextraktionen

Feld Typ Beschreibung Beispiel
AccountNumber string Kontonummer auf dem Kontoauszug 987-654-3210
AccountType string Kontotyp auf dem Kontoauszug Wird geprüft
BankAddress address Gelistete Adresse der Bank 123 Main St., Redmond, Washington 98052
BankName string Eingetragener Name der Bank Contoso Bank
AccountHolderAddress address Adresse des Kontoinhabers 456 Main St., Redmond, Washington 98052
AccountHolderName string Name des Kontoinhabers JOHN DOE
EndingBalance number Endsaldo auf dem Kontoauszug $ 1488,03
BeginningBalance number Anfangssaldo auf dem Kontoauszug $ 1488,03
StatementStartDate date Datum des Anfangssaldos des Kontoauszugs 01. Juli 2017
StatementEndDate date Datum des Endsaldos des Kontoauszugs 31. Juli 2017
TotalServiceFees number Servicegebühren insgesamt 0,00 USD
Transactions array Extrahierte Transaktionsposition 07/17
OnlineTransfer From Check...6609 Transaction#: 6373187418
$ 1.500,00
Transactions.* object
Transactions.*.Date date Buchungsdatum 07/17
Transactions.*.Description string Transaktionsbeschreibung OnlineTransfer From Check...6609 Transaction#: 6373187418
Transactions.*.CheckNumber string Schecknummer der Transaktion 6609
Transactions.*.DepositAmount number Einzahlungsbetrag der Transaktion $ 1.500,00
Transactions.*.WithdrawalAmount number Auszahlungsbetrag der Transaktion $ 1.500,00

Unterstützte Gebietsschemas

Die prebuilt-bankStatement.us Version 2027-07-31-preview unterstützt die Region en-us.

Nächste Schritte