Dokument Intelligenz-Belegmodell

Wichtig

  • Public Preview-Releases von Dokument Intelligenz bieten frühzeitigen Zugriff auf Features, die sich in der aktiven Entwicklung befinden.
  • Features, Ansätze und Prozesse können sich aufgrund von Benutzerfeedback vor der allgemeinen Verfügbarkeit (General Availability, GA) ändern.
  • Die öffentliche Vorschauversion der Clientbibliotheken für Dokument-Intelligence ist standardmäßig die REST-API-Version 2024-02-29-preview.
  • Öffentliche Vorschauversion 2024-02-29-preview ist derzeit nur in den folgenden Azure-Regionen verfügbar:
  • USA, Osten
  • USA, Westen 2
  • Europa, Westen

Dieser Inhalt gilt für:Häkchenv4.0 (Vorschau) | Vorherige Versionen:Blaues Häkchenv3.1 (GA)Blaues Häkchenv3.0 (GA)Blaues Häkchenv2.1 (GA)

Dieser Inhalt gilt für:Häkchenv3.1 (GA) | Aktuelle Version:Lila Häkchenv4.0 (Vorschau) | Vorherige Versionen:Blaues Häkchenv3.0Blaues Häkchenv2.1

Dieser Inhalt gilt für:Häkchenv3.0 (GA) | Aktuelle Versionen:Lila Häkchenv4.0 (Vorschau)Lila Häkchenv3.1 | Vorherige Version:Blaues Häkchenv2.1

Dieser Inhalt gilt für:Häkchenv2.1 | Neueste Version:blaues-häkchenv4.0 (Vorschau)

Das Belegmodell von Dokument Intelligenz kombiniert leistungsstarke OCR-Funktionen (Optical Character Recognition, optische Zeichenerkennung) mit Deep Learning-Modellen, um wichtige Informationen aus Kaufbelegen zu analysieren und zu extrahieren. Belege können verschiedene Formate und unterschiedliche Qualität aufweisen, einschließlich gedruckter und handschriftlicher Belege. Die API extrahiert Schlüsselinformationen wie Händlername, Händlertelefonnummer, Transaktionsdatum, Steuer und Transaktionssumme und gibt strukturierte JSON-Daten zurück.

Unterstützte Belegtypen:

  • Thermal
  • Kreditkarte
  • Gas
  • Parkplatz
  • Hotel
  • Transport
  • Kommunikation
  • Entertainment
  • Flug
  • Training
  • Apotheke/Medizin

Datenextraktion von Belegdaten

Die Digitalisierung von Belegen umfasst die Umwandlung verschiedener Belegtypen, einschließlich gescannter, fotografierter und gedruckter Kopien, in ein digitales Format für eine optimierte Nachverarbeitung. Beispiele hierfür sind Kostenverwaltung, Verbraucherverhaltensanalyse oder die Automatisierung von Steuern. Mithilfe von Dokument Intelligenz mit OCR-Technologie (Optical Character Recognition) können Daten aus diesen verschiedenen Belegformaten extrahiert und interpretiert werden. Die Dokument Intelligenz-Verarbeitung vereinfacht nicht nur den Konvertierungsprozess, sie reduziert auch Zeit- und Arbeitsaufwand erheblich und ermöglicht so mehr Effizienz bei Datenverwaltung und -abruf.

Beispielbeleg, der mit Dokument Intelligenz Studio verarbeitet wurde:

Screenshot: in Dokument Intelligenz Studio verarbeiteter Beispielbeleg

Beispielbeleg, der mit dem Tool zur Beschriftung von Beispielen in Dokument Intelligenz Studio verarbeitet wurde:

Screenshot eines Beispielbelegs, der mit dem Tool zur Bezeichnung von Formularbeispielen verarbeitet wurde.

Entwicklungsoptionen

Document Intelligence v4.0 (2024-02-29-preview, 2023-10-31-preview) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Funktion Ressourcen Modell-ID
Belegmodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-receipt

Document Intelligence v3.1 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature Ressourcen Modell-ID
Belegmodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-receipt

Document Intelligence v3.0 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature Ressourcen Modell-ID
Belegmodell Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK
prebuilt-receipt

Document Intelligence v2.1 unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature Ressourcen
Belegmodell Document Intelligence-Bezeichnungstool
REST-API
Clientbibliothek SDK
Document Intelligence Docker-Container

Eingabeanforderungen

  • Die besten Ergebnisse erzielen Sie, wenn Sie pro Dokument ein deutliches Foto oder einen hochwertigen Scan bereitstellen.

  • Unterstützte Dateiformate:

    Modell PDF Bild:
    JPEG/JPG, PNG, BMP, TIFF, HEIF
    Microsoft Office:
    Word (DOCX), Excel (XLSX), PowerPoint (PPTX) und HTML
    Lesen
    Layout ✔ (2024-02-29-preview, 2023-10-31-preview)
    Allgemeines Dokument
    Vordefiniert
    Benutzerdefinierte Extraktion
    Benutzerdefinierte Klassifizierung ✔ (2024-02-29-preview)
  • In den Formaten PDF und TIFF können bis zu 2.000 Seiten verarbeitet werden (bei einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet).

  • Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für die kostenpflichtige (S0) und 4 MB für die kostenlose (F0) Stufe.

  • Die Bildgrößen müssen im Bereich zwischen 50 × 50 Pixel und 10.000 × 10.000 Pixel liegen.

  • Wenn Ihre PDFs kennwortgeschützt sind, müssen Sie die Sperre vor dem Senden entfernen.

  • Die Mindesthöhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 × 768 Pixel. Diese Abmessung entspricht etwa einem 8-Punkt-Text bei 150 Punkten pro Zoll (Dots per Inch, DPI).

  • Die maximale Anzahl Seiten für Trainingsdaten beträgt beim benutzerdefinierten Modelltraining 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neuronale Modell.

    • Für das Training des benutzerdefinierten Extraktionsmodells beträgt die Gesamtgröße der Trainingsdaten 50 MB für das Vorlagenmodell und 1G-MB für das neuronale Modell.

    • Für das Training des benutzerdefinierten Klassifizierungsmodells beträgt die Gesamtgröße der Trainingsdaten 1GB mit einem Maximum von 10 000 Seiten.

  • Unterstützte Dateiformate: JPEG, PNG, PDF und TIFF.
  • Unterstützte Seitenzahl für PDF und TIFF: Document Intelligence kann bis zu 2.000 Seiten für Abonnenten der Standardstufe oder nur die ersten beiden Seiten für Abonnenten der kostenlosen Stufe verarbeiten.
  • Unterstützte Dateigröße: weniger als 50 MB; Mindestpixel 50 x 50 px; Maximale Pixel 10.000 x 10.000 px.

Extrahieren von Belegmodelldaten

Hier erfahren Sie, wie Dokument Intelligenz Daten aus Belegen extrahiert – einschließlich Transaktionszeit und -datum sowie Händlerinformationen und Beträge. Sie benötigen die folgenden Ressourcen:

  • Ein Azure-Abonnement (Sie können ein kostenloses Abonnement erstellen).

  • Eine Dokument Intelligenz-Instanz im Azure-Portal. Sie können den kostenlosen Tarif (F0) verwenden, um den Dienst auszuprobieren. Wählen Sie nach der Bereitstellung Ihrer Ressource Zu Ressource wechseln aus, um Ihren Schlüssel und Endpunkt abzurufen.

Screenshot: Schlüssel und Endpunkt im Azure-Portal

Hinweis

Dokument Intelligenz Studio ist mit den APIs der Versionen 3.1 und 3.0 und höheren Versionen verfügbar.

  1. Wählen Sie auf der Startseite von Dokument Intelligenz Studio die Option Belege aus.

  2. Sie können den Musterbeleg analysieren oder Ihre eigenen Dateien hochladen.

  3. Wählen Sie die Schaltfläche Analyse ausführen aus, und konfigurieren Sie bei Bedarf die Analyseoptionen:

    Screenshot der Schaltflächen „Analyse ausführen“ und „Analyseoptionen“ im Document Intelligence Studio.

Beispielbeschriftungstool von Dokument Intelligenz

  1. Navigieren Sie zum Dokument Intelligenz-Beispieltool.

  2. Wählen Sie auf der Startseite des Beispieltools die Kachel Use prebuilt model to get data (Vordefiniertes Modell zum Abrufen von Daten verwenden) aus.

    Screenshot des Vorgangs zur Ergebnisanalyse des Layoutmodells.

  3. Wählen Sie im Dropdownfenster den zu analysierenden Formulartyp aus.

  4. Wählen Sie aus den folgenden Optionen eine URL zu der Datei aus, die Sie analysieren möchten:

  5. Wählen Sie im Feld Quelle die URL aus dem Dropdownmenü aus, fügen Sie die ausgewählte URL ein, und wählen Sie die Schaltfläche Abrufen aus.

    Screenshot des Dropdown-Menüs für den Quellort.

  6. Fügen Sie im Feld Dokument Intelligenz-Dienstendpunkt den Endpunkt ein, den Sie mit Ihrem Dokument Intelligenz-Abonnement erhalten haben.

  7. Fügen Sie im Feld Schlüssel den Schlüssel ein, den Sie von Ihrer Dokument Intelligenz-Ressource erhalten haben.

    Screenshot: Dropdownmenü zum Auswählen des Formulartyps.

  8. Wählen Sie Run Analysis (Analyse ausführen) aus. Das Dokument Intelligenz-Tool für die Beschriftung von Beispielen ruft die „Analyze Prebuilt“-API auf und analysiert das Dokument.

  9. Zeigen Sie die Ergebnisse an. Sehen Sie sich die extrahierten Schlüssel-Wert-Paare, die Positionen, den extrahierten markierten Text und die erkannten Tabellen an.

    Screenshot des Vorgangs zur Ergebnisanalyse des Layoutmodells.

Hinweis

Das Tool für die Beschriftung von Beispielen unterstützt nicht das BMP-Dateiformat. Dies ist eine Einschränkung des Tools, nicht des Dokument Intelligenz-Diensts.

Unterstützte Sprachen und Gebietsschemas

Eine vollständige Liste der unterstützten Sprachen finden Sie unter Sprachunterstützung ‒ vordefinierte Modelle.

Feldextraktion

Name Typ BESCHREIBUNG Standardisierte Ausgabe
ReceiptType String Der Typ des Belegs Aufgeschlüsselt
MerchantName String Der Name des Händlers, der den Beleg ausstellt
MerchantPhoneNumber phoneNumber Die aufgeführte Telefonnummer des Händlers +1 xxx xxx xxxx
MerchantAddress String Die aufgeführte Adresse des Händlers
TransactionDate Datum Das Datum der Ausstellung des Belegs yyyy-mm-dd
TransactionTime Time Die Uhrzeit der Ausstellung des Belegs hh-mm-ss (24 Stunden)
Gesamt Betrag (USD) Die Gesamttransaktion des Belegs Gleitkommazahl mit zwei Dezimalstellen
Subtotal (Zwischensumme) Betrag (USD) Die Zwischensumme des Belegs, oft vor Steuern Gleitkommazahl mit zwei Dezimalstellen
Tax (Steuern) Betrag (USD) Gesamtsteuerbetrag auf dem Beleg (oft Mehrwertsteuer oder Äquivalent). Umbenannt in „TotalTax“ (Gesamtsteuerbetrag) in Version 2022-06-30. Gleitkommazahl mit zwei Dezimalstellen
Tipp Betrag (USD) Vom Käufer gegebenes Trinkgeld Gleitkommazahl mit zwei Dezimalstellen
Elemente Array von Objekten Die extrahierten Positionen mit extrahierten Werten für Name, Menge, Stückpreis und Gesamtpreis
Name String Beschreibung der Position. Umbenannt in „Description“ (Beschreibung) in Version 2022-06-30.
Menge Number Menge der einzelnen Positionen Gleitkommazahl mit zwei Dezimalstellen
Preis Number Einzelpreis der einzelnen Positionen Gleitkommazahl mit zwei Dezimalstellen
Gesamtpreis Number Gesamtpreis der Position Gleitkommazahl mit zwei Dezimalstellen

In Dokument Intelligenz 3.0 und höheren Versionen werden mehrere neue Features und Funktionen eingeführt. Zusätzlich zu thermischen Belegen unterstützt das Belegsmodell die Einzelseitenverarbeitung von Hotelbelegen und die Extraktion von Steuerdetails für alle Belegtypen.

Document Intelligence v4.0 und neuere Versionen unterstützen Währungen für alle preisbezogenen Felder für thermische und Hotel-Receipts.

Rechnung

Feld Typ Beschreibung des Dataflows Beispiel
MerchantName string Der Name des Händlers, der den Beleg ausstellt Contoso
MerchantPhoneNumber phoneNumber Die aufgeführte Telefonnummer des Händlers 987-654-3210
MerchantAddress address Die aufgeführte Adresse des Händlers 123 Main St. Redmond, Washington 98052
Total number Die Gesamttransaktion des Belegs $14.34
TransactionDate date Das Datum der Ausstellung des Belegs June 06, 2019
TransactionTime time Die Uhrzeit der Ausstellung des Belegs 4:49 PM
Subtotal number Die Zwischensumme des Belegs, oft vor Steuern $12.34
TotalTax number Die Steuern auf dem Beleg (oft Mehrwertsteuer oder Äquivalent) 2 $
Tip number Vom Käufer gegebenes Trinkgeld $1.00
Items array
Items.* object Extrahierte Zeilenposition 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Gesamtpreis der Position $999.00
Items.*.Description string Beschreibung der Position Surface Pro 6
Items.*.Quantity number Menge der einzelnen Positionen 1
Items.*.Price number Einzelpreis der einzelnen Positionen $999.00
Items.*.ProductCode string Produktcode, Produktnummer oder SKU der spezifischen Rechnungsposition A123
Items.*.QuantityUnit string Mengeneinheit jeder Position
TaxDetails array
TaxDetails.* object Extrahierte Zeilenposition 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency Details zur Höhe der Steuern $999.00

receipt.retailMeal

Feld Typ Beschreibung des Dataflows Beispiel
MerchantName string Der Name des Händlers, der den Beleg ausstellt Contoso
MerchantPhoneNumber phoneNumber Die aufgeführte Telefonnummer des Händlers 987-654-3210
MerchantAddress address Die aufgeführte Adresse des Händlers 123 Main St. Redmond, Washington 98052
Total number Die Gesamttransaktion des Belegs $14.34
TransactionDate date Das Datum der Ausstellung des Belegs June 06, 2019
TransactionTime time Die Uhrzeit der Ausstellung des Belegs 4:49 PM
Subtotal number Die Zwischensumme des Belegs, oft vor Steuern $12.34
TotalTax number Die Steuern auf dem Beleg (oft Mehrwertsteuer oder Äquivalent) 2 $
Tip number Vom Käufer gegebenes Trinkgeld $1.00
Items array
Items.* object Extrahierte Zeilenposition 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Gesamtpreis der Position $999.00
Items.*.Description string Beschreibung der Position Surface Pro 6
Items.*.Quantity number Menge der einzelnen Positionen 1
Items.*.Price number Einzelpreis der einzelnen Positionen $999.00
Items.*.ProductCode string Produktcode, Produktnummer oder SKU der spezifischen Rechnungsposition A123
Items.*.QuantityUnit string Mengeneinheit jeder Position
TaxDetails array
TaxDetails.* object Extrahierte Zeilenposition 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency Details zur Höhe der Steuern $999.00

receipt.creditCard

Feld Typ Beschreibung des Dataflows Beispiel
MerchantName string Der Name des Händlers, der den Beleg ausstellt Contoso
MerchantPhoneNumber phoneNumber Die aufgeführte Telefonnummer des Händlers 987-654-3210
MerchantAddress address Die aufgeführte Adresse des Händlers 123 Main St. Redmond, Washington 98052
Total number Die Gesamttransaktion des Belegs $14.34
TransactionDate date Das Datum der Ausstellung des Belegs June 06, 2019
TransactionTime time Die Uhrzeit der Ausstellung des Belegs 4:49 PM
Subtotal number Die Zwischensumme des Belegs, oft vor Steuern $12.34
TotalTax number Die Steuern auf dem Beleg (oft Mehrwertsteuer oder Äquivalent) 2 $
Tip number Vom Käufer gegebenes Trinkgeld $1.00
Items array
Items.* object Extrahierte Zeilenposition 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Gesamtpreis der Position $999.00
Items.*.Description string Beschreibung der Position Surface Pro 6
Items.*.Quantity number Menge der einzelnen Positionen 1
Items.*.Price number Einzelpreis der einzelnen Positionen $999.00
Items.*.ProductCode string Produktcode, Produktnummer oder SKU der spezifischen Rechnungsposition A123
Items.*.QuantityUnit string Mengeneinheit jeder Position
TaxDetails array
TaxDetails.* object Extrahierte Zeilenposition 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency Details zur Höhe der Steuern $999.00

receipt.gas

Feld Typ Beschreibung des Dataflows Beispiel
MerchantName string Der Name des Händlers, der den Beleg ausstellt Contoso
MerchantPhoneNumber phoneNumber Die aufgeführte Telefonnummer des Händlers 987-654-3210
MerchantAddress address Die aufgeführte Adresse des Händlers 123 Main St. Redmond, Washington 98052
Total number Die Gesamttransaktion des Belegs $14.34
TransactionDate date Das Datum der Ausstellung des Belegs June 06, 2019
TransactionTime time Die Uhrzeit der Ausstellung des Belegs 4:49 PM
Subtotal number Die Zwischensumme des Belegs, oft vor Steuern $12.34
TotalTax number Die Steuern auf dem Beleg (oft Mehrwertsteuer oder Äquivalent) 2 $
Tip number Vom Käufer gegebenes Trinkgeld $1.00
Items array
Items.* object Extrahierte Zeilenposition 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Gesamtpreis der Position $999.00
Items.*.Description string Beschreibung der Position Surface Pro 6
Items.*.Quantity number Menge der einzelnen Positionen 1
Items.*.Price number Einzelpreis der einzelnen Positionen $999.00
Items.*.ProductCode string Produktcode, Produktnummer oder SKU der spezifischen Rechnungsposition A123
Items.*.QuantityUnit string Mengeneinheit jeder Position
TaxDetails array
TaxDetails.* object Extrahierte Zeilenposition 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency Details zur Höhe der Steuern $999.00

receipt.parking

Feld Typ Beschreibung des Dataflows Beispiel
MerchantName string Der Name des Händlers, der den Beleg ausstellt Contoso
MerchantPhoneNumber phoneNumber Die aufgeführte Telefonnummer des Händlers 987-654-3210
MerchantAddress address Die aufgeführte Adresse des Händlers 123 Main St. Redmond, Washington 98052
Total number Die Gesamttransaktion des Belegs $14.34
TransactionDate date Das Datum der Ausstellung des Belegs June 06, 2019
TransactionTime time Die Uhrzeit der Ausstellung des Belegs 4:49 PM
Subtotal number Die Zwischensumme des Belegs, oft vor Steuern $12.34
TotalTax number Die Steuern auf dem Beleg (oft Mehrwertsteuer oder Äquivalent) 2 $
Tip number Vom Käufer gegebenes Trinkgeld $1.00
Items array
Items.* object Extrahierte Zeilenposition 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Gesamtpreis der Position $999.00
Items.*.Description string Beschreibung der Position Surface Pro 6
Items.*.Quantity number Menge der einzelnen Positionen 1
Items.*.Price number Einzelpreis der einzelnen Positionen $999.00
Items.*.ProductCode string Produktcode, Produktnummer oder SKU der spezifischen Rechnungsposition A123
Items.*.QuantityUnit string Mengeneinheit jeder Position
TaxDetails array
TaxDetails.* object Extrahierte Zeilenposition 1
Surface Pro 6
$999.00
$999.00
TaxDetails.*.Amount currency Details zur Höhe der Steuern $999.00

receipt.hotel

Feld Typ Beschreibung des Dataflows Beispiel
MerchantName string Der Name des Händlers, der den Beleg ausstellt Contoso
MerchantPhoneNumber phoneNumber Die aufgeführte Telefonnummer des Händlers 987-654-310
MerchantAddress address Die aufgeführte Adresse des Händlers 123 Main St. Redmond, Washington 98052
Total number Die Gesamttransaktion des Belegs $14.34
ArrivalDate date Ankunftsdatum 27. März 21
DepartureDate date Abreisedatum 28. März 21
Currency string Währungseinheit der Belegbeträge (ISO 4217) oder „GEMISCHT“, wenn mehrere Werte gefunden werden USD
MerchantAliases array
MerchantAliases.* string Alternativer Name des Händlers Contoso (R)
Items array
Items.* object Extrahierte Zeilenposition 1
Surface Pro 6
$999.00
$999.00
Items.*.TotalPrice number Gesamtpreis der Position $999.00
Items.*.Description string Beschreibung der Position Zimmergebühr
Items.*.Date date Datum der Position 27. März 21
Items.*.Category string Positionskategorie Raum

Migrationsleitfaden und REST-API 3.1

Nächste Schritte