Dokumentverarbeitungsmodelle

Artikel
04/15/2024

Wichtig

Public Preview-Releases von Dokument Intelligenz bieten frühzeitigen Zugriff auf Features, die sich in der aktiven Entwicklung befinden.
Features, Ansätze und Prozesse können sich aufgrund von Benutzerfeedback vor der allgemeinen Verfügbarkeit (General Availability, GA) ändern.
Die öffentliche Vorschauversion der Clientbibliotheken für Dokument-Intelligence ist standardmäßig die REST-API-Version 2024-02-29-preview.
Öffentliche Vorschauversion 2024-02-29-preview ist derzeit nur in den folgenden Azure-Regionen verfügbar:
USA, Osten
USA, Westen 2
Europa, Westen

Dieser Inhalt gilt für:v4.0 (Vorschau) | Vorherige Versionen:v3.1 (GA)v3.0 (GA)v2.1 (GA)

Dieser Inhalt gilt für:v3.1 (GA) | Aktuelle Version:v4.0 (Vorschau) | Vorherige Versionen:v3.0v2.1

Dieser Inhalt gilt für:v3.0 (GA) | Aktuelle Versionen:v4.0 (Vorschau)v3.1 | Vorherige Version:v2.1

Dieser Inhalt gilt für:v2.1 | Neueste Version:v4.0 (Vorschau)

Azure KI Dokument Intelligenz unterstützt eine Vielzahl von Modellen, mit denen Sie Ihren Apps und Flows intelligente Dokumentverarbeitung hinzufügen können. Sie können ein vordefiniertes domänenspezifisches Modell oder ein benutzerdefiniertes Modell trainieren, das auf Ihre spezifischen Geschäftsanforderungen und Anwendungsfälle zugeschnitten ist. Dokument Intelligenz kann mit der REST-API oder Python-, C#-, Java- und JavaScript-Clientbibliotheken verwendet werden.

Übersicht über das Modell

In der folgenden Tabelle sind die verfügbaren Modelle für jede aktuelle Vorschau- und stabile API aufgeführt:

Modelltyp	Modell	• 2024-02-29-preview &bullet 2023-10-31-preview	2023-07-31 (GA)	2022-08-31 (GA)	v2.1 (GA)
Dokumentanalysemodelle	Lesen	✔️	✔️	✔️	–
Dokumentanalysemodelle	Layout	✔️	✔️	✔️	✔️
Dokumentanalysemodelle	Allgemeines Dokument	in das Layout verschoben**	✔️	✔️	–
Vordefinierte Modelle	Vertrag	✔️	✔️	–	–
Vordefinierte Modelle	Krankenversicherungskarte	✔️	✔️	✔️	–
Vordefinierte Modelle	ID-Dokument	✔️	✔️	✔️	✔️
Vordefinierte Modelle	Rechnung	✔️	✔️	✔️	✔️
Vordefinierte Modelle	Rechnung	✔️	✔️	✔️	✔️
Vordefinierte Modelle	US 1040 Tax*	✔️	✔️	–	–
Vordefinierte Modelle	US 1098 Tax*	✔️	–	n/v	–
Vordefinierte Modelle	US 1099 Tax*	✔️	–	n/v	–
Vordefinierte Modelle	US W2 Tax	✔️	✔️	✔️	–
Vordefinierte Modelle	US-Hypothek 1003 URLA	✔️	–	n/v	–
Vordefinierte Modelle	US Mortgage 1008 Zusammenfassung	✔️	–	n/v	–
Vordefinierte Modelle	US-Hypothekenabschluss-Offenlegung	✔️	–	n/v	–
Vordefinierte Modelle	Heiratsurkunde	✔️	–	n/v	–
Vordefinierte Modelle	Kreditkarte	✔️	–	n/v	–
Vordefinierte Modelle	Visitenkarte	deprecated	✔️	✔️	✔️
Benutzerdefiniertes Klassifizierungsmodell	Benutzerdefinierter Klassifizierer	✔️	✔️	–	Nicht zutreffend
Benutzerdefiniertes Extraktionsmodell	Benutzerdefiniertes neuronales Modell	✔️	✔️	✔️	Nicht zutreffend
Customextraction-Modell	Benutzerdefinierte Vorlage	✔️	✔️	✔️	✔️
Benutzerdefiniertes Extraktionsmodell	Benutzerdefiniert zusammengesetzt	✔️	✔️	✔️	✔️
Alle Modelle	Add-On-Funktionen	✔️	✔️	–	Nicht zutreffend

* – Enthält Untermodelle. Informationen zu unterstützten Variationen und Untertypen finden Sie in den modellspezifischen Informationen.

Add-On-Funktion	Add-On/Free	• 2024-02-29-preview &bullet [2023-10-31-preview](/rest/api/aiservices/operation-groups?view=rest-aiservices-2024-02-29-preview&preserve-view=true	`2023-07-31` (GA)	`2022-08-31` (GA)	v2.1 (GA)
Extraktion von Schrifteigenschaften	Add-On	✔️	✔️	–	–
Formelextraktion	Add-On	✔️	✔️	–	–
Hochauflösende Extraktion	Add-On	✔️	✔️	–	–
Barcodeextraktion	Kostenlos	✔️	✔️	–	–
Sprachenerkennung	Kostenlos	✔️	✔️	–	–
Schlüssel-Wert-Paare	Kostenlos	✔️	–	n/v	–
Abfragefelder	Add-On*	✔️	–	n/v	Nicht zutreffend

Funktionen der Modellanalyse

Modell-ID	Inhaltsextraktion	Abfragefelder	Absätze	Absatzrollen	Auswahlmarkierungen	Tabellen	Schlüssel-Wert-Paare	Sprachen	Barcodes	Dokumentanalyse	Formeln*	Schriftstil*	Hohe Auflösung*
prebuilt-read	✓						O	O		O	O	O
prebuilt-layout	✓	✓	✓	✓	✓	✓		O	O		O	O	O
prebuilt-document	✓	✓	✓	✓	✓	✓	✓	O	O		O	O	O
prebuilt-businessCard	✓	✓								✓
prebuilt-contract	✓	✓	✓	✓			O	O	✓	O	O	O
prebuilt-healthInsuranceCard.us	✓	✓						O	O	✓	O	O	O
prebuilt-idDocument	✓	✓						O	O	✓	O	O	O
Vordefinierte Rechnung	✓	✓			✓	✓	O	O	O	✓	O	O	O
prebuilt-receipt	✓	✓						O	O	✓	O	O	O
prebuilt-marriageCertificate.us	✓	✓						O	O	✓	O	O	O
prebuilt-creditCard	✓	✓						O	O	✓	O	O	O
prebuilt-mortgage.us.1003	✓	✓						O	O	✓	O	O	O
prebuilt-mortgage.us.1008	✓	✓						O	O	✓	O	O	O
prebuilt-mortgage.us.closingDisclosure	✓	✓						O	O	✓	O	O	O
prebuilt-tax.us.w2	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.1098	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.1098E	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.1098T	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.1099(Varianten)	✓	✓			✓			O	O	✓	O	O	O
prebuilt-tax.us.1040(variations)	✓	✓						O	O	✓	O	O	O
{ customModelName }	✓	✓	✓	✓	✓	✓		O	O	✓	O	O	O

✓ – Aktiviert
O – Optional
* – Durch Premium-Features entstehen zusätzliche Kosten

Add-On*: Abfragefelder werden anders berechnet als die anderen Add-On-Features. Weitere Informationen finden Sie unter Preise.

Modell	Beschreibung
Dokumentanalysemodelle
Read OCR	Extrahieren gedruckter und handschriftlicher Texte, einschließlich Wörter, Orte und erkannter Sprachen.
Layoutanalyse	Extrahieren von Text- und Dokumentlayoutelementen wie Tabellen, Auswahlmarkierungen, Titeln, Abschnittsüberschriften und mehr.
Vordefinierte Modelle
Krankenversicherungskarte	Automatisieren Sie Prozesse im Gesundheitswesen, indem Sie Versicherer, Mitglied, Rezept, Gruppennummer und andere wichtige Informationen von US-Krankenversicherungskarten extrahieren.
US-Steuerdokumentmodelle	Verarbeiten von US-Steuerformularen, um Mitarbeiter, Arbeitgeber, Lohn und andere Informationen zu extrahieren.
US-Hypothekendokumentmodelle	Sie können US-Hypothekenformulare verarbeiten, um Kredit- und Immobilieninformationen für Darlehensnehmer zu extrahieren.
Vertrag	Extrahieren von Vereinbarungs- und Parteiendetails.
Rechnung	Automatisieren Sie Rechnungen.
Rechnung	Extrahieren Sie Belegdaten aus Belegen.
Identitätsdokument (ID)	Extrahieren von Identitätsfeldern (ID) aus US-Führerscheinen und internationalen Reisepässen.
Visitenkarte	Scannen von Visitenkarten, um wichtige Felder und Daten in Ihre Anwendungen zu extrahieren.
Benutzerdefinierte Modelle
Benutzerdefiniertes Modell (Übersicht)	Extrahieren Sie Daten aus Formularen und Dokumenten, die für Ihr Unternehmen spezifisch sind. Benutzerdefinierte Modelle werden speziell für Ihre individuellen Daten und Anwendungsfälle trainiert.
Benutzerdefinierte Extraktionsmodelle	● Benutzerdefinierte Vorlagenmodelle verwenden Layouthinweise, um Werte aus Dokumenten zu extrahieren, und eignen sich zur Extraktion von Feldern aus stark strukturierten Dokumenten mit definierten visuellen Vorlagen. ● Benutzerdefinierte neuronale Modelle werden anhand verschiedener Dokumenttypen trainiert, um Felder aus strukturierten, halbstrukturierten und unstrukturierten Dokumenten zu extrahieren.
Benutzerdefiniertes Klassifizierungsmodell	Das benutzerdefinierte Klassifizierungsmodell kann jede Seite in einer Eingabedatei klassifizieren, um die darin enthaltenen Dokumente zu identifizieren. Es kann auch mehrere Dokumente oder mehrere Instanzen eines einzelnen Dokuments innerhalb einer Eingabedatei identifizieren.
Zusammengesetzte Modelle	Kombinieren mehrerer benutzerdefinierter Modelle in ein einzelnes Modell, um die Verarbeitung verschiedener Dokumenttypen mit einem einzelnen zusammengesetzten Modell zu automatisieren.

Für alle Modelle mit Ausnahme des Visitenkartenmodells unterstützt Dokument Intelligenz jetzt Add-On-Funktionen, um eine komplexere Analyse zu ermöglichen. Diese optionalen Funktionen können je nach Szenario der Dokumentextraktion aktiviert und deaktiviert werden. Für das Release 2023-07-31 (allgemeine Verfügbarkeit) und die spätere API-Version stehen sieben Add-On-Funktionen zur Verfügung:

ocrHighResolution
formulas
styleFont
barcodes
languages
keyValuePairs (2024-02-29-preview, 2023-10-31-preview)
queryFields (2024-02-29-preview, 2023-10-31-preview) Not available with the US.Tax models

Modelldetails

In diesem Abschnitt wird die Ausgabe beschrieben, die Sie von jedem Modell erwarten können. Bitte beachten Sie, dass Sie die Ausgabe der meisten Modelle mit Add-On-Features erweitern können.

Read OCR

Die Lese-API analysiert und extrahiert Zeilen, Wörter, deren Positionen, erkannte Sprachen und Handschrift, falls erkannt.

Beispieldokument verarbeitet mit Dokument Intelligenz Studio:

Screenshot eines Beispieldokuments, das mithilfe der Lese-API von Dokument Intelligenz Studio verarbeitet wurde

Weitere Informationen: Lesemodell

Layoutanalyse

Das Layoutanalysemodell analysiert und extrahiert Text, Tabellen, Auswahlmarkierungen und andere Strukturelemente wie Titel, Abschnittsüberschriften, Seitenkopfzeilen, Seitenfußzeilen und mehr.

Beispieldokument verarbeitet mit Dokument Intelligenz Studio:

Screenshot einer Beispielseite aus einer Zeitung, die mit Dokument Intelligenz Studio verarbeitet wurde

Mehr erfahren: Layout-Modell

Krankenversicherungskarte

Das Krankenversicherungskartenmodell kombiniert leistungsstarke Funktionen zur optischen Zeichenerkennung (Optical Character Recognition, OCR) mit Deep Learning-Modellen, um wichtige Informationen aus US-Krankenversicherungskarten zu analysieren und zu extrahieren.

Beispiel für eine mit Dokument Intelligenz Studio verarbeitete US-Krankenversicherungskarte:

Weitere Informationen: Modell der Krankenversicherungskarte

US-Steuerdokumente

Die US-Steuerdokumentmodelle analysieren und extrahieren Schlüsselfelder und Positionen aus einer ausgewählten Gruppe von Steuerdokumenten. Die API unterstützt die Analyse von englischsprachigen US-Steuerdokumenten verschiedener Formate und Qualität, einschließlich per Smartphone erfasster Bilder, gescannter Dokumente und digitaler PDFs. Die folgenden Modelle werden derzeit unterstützt:

Modell	Beschreibung	ModelID
US-Steuer W-2	Extrahieren Sie Details zur steuerpflichtigen Ausgleichszahlung.	prebuilt-tax.us.W-2
US Tax 1040	Extrahieren von Details zu Hypothekenzinsen.	prebuilt-tax.us.1040(variations)
US-Steuer 1098	Extrahieren von Details zu Hypothekenzinsen.	prebuilt-tax.us.1098(variations)
US Tax 1099	Extrahieren von Einnahmen aus anderen Quellen als dem Arbeitgeber.	prebuilt-tax.us.1099 (Varianten)

W-2-Beispieldokument verarbeitet mit Dokument Intelligenz Studio:

Screenshot eines Beispiels für W-2.

Weitere Informationen: Steuerdokumentmodelle

US-Hypothekendokumente

Die Modelle für US-Hypothekendokumente analysieren und extrahieren Schlüsselfelder, einschließlich Darlehens-, Kredit- und Immobilieninformationen aus einer ausgewählten Gruppe von Hypothekendokumenten. Die API unterstützt die Analyse von englischsprachigen US-Hypothekendokumenten verschiedener Formate und Qualität, einschließlich per Smartphone erfasster Bilder, gescannter Dokumente und digitaler PDFs. Die folgenden Modelle werden derzeit unterstützt:

Modell	Beschreibung	ModelID
1003 Microsoft-Software-Lizenzbedingungen (EULA)	Extrahieren von Informationen zu Darlehen, Darlehensnehmer, Immobilien.	prebuilt-mortgage.us.1003
Zusammenfassungsdokument 1008	Extrahieren von Informationen zu Darlehensnehmer, Verkäufer, Immobilie, Hypotheken und Absicherung.	prebuilt-mortgage.us.1008
Offenlegung des Abschlusses	Extrahieren von Informationen zu Abschluss, Transaktionskosten und Kreditdetails.	prebuilt-mortgage.us.closingDisclosure
Heiratsurkunde	Extrahieren von Eheinformationen für gemeinschaftliche Kreditantragsteller.	prebuilt-marriageCertificate
US-Steuer W-2	Extrahieren von Details zur steuerpflichtigen Vergütung für die Einkommensprüfung.	prebuilt-tax.us.W-2

Beispieldokument für die Abschlussoffenlegung, verarbeitet mit Document Intelligence Studio:

Screenshot eines Beispiels für die Abschlussoffenlegung.

Weitere Informationen: Modelle für Hypothekendokumente

Vertrag

Das Vertragsmodell analysiert und extrahiert Schlüsselfelder und Zeilenelemente aus Vertragsvereinbarungen, einschließlich Parteien, Gerichtsbarkeiten, Vertrags-IDs und Titeln. Das Modell unterstützt derzeit englischsprachige Vertragsdokumente.

Beispielvertrag verarbeitet mit Dokument Intelligenz Studio:

Screenshot der Vertragsmodellextraktion mit Dokument Intelligenz Studio

Weitere Informationen: Vertragsmodell

Rechnung

Das Rechnungsmodell automatisiert die Verarbeitung von Rechnungen, um Kundennamen, Abrechnungsadresse, Fälligkeitsdatum und fälliger Betrag, Rechnungspositionen und andere Schlüsseldaten zu extrahieren. Derzeit unterstützt das Modell englische, spanische, deutsche, französische, italienische, portugiesische und niederländische Rechnungen.

Beispielrechnung verarbeitet mit Dokument Intelligenz Studio:

Mehr erfahren: Rechnungsmodell

Rechnung

Verwenden Sie das Belegmodell, um Verkaufsquittungen auf Händlernamen, Datumsangaben, Artikelpositionen, Mengen und Summen aus gedruckten und handschriftlichen Belegen zu scannen. Die Version v3.0 unterstützt auch die Verarbeitung einseitiger Hotelbelege.

Beispielbeleg verarbeitet mit Dokument Intelligenz Studio:

Mehr erfahren: Eingangsmodell

Identitätsdokument (ID)

Mit dem Identitätsdokumentmodell (ID) können Sie US-Führerscheine (alle 50 Bundesstaaten und District of Columbia) und Seiten mit biografischen Angaben aus internationalen Reisepässen (ohne Visa und andere Reisedokumente) verarbeiten, um wichtige Felder zu extrahieren.

US-Beispielfahrerlaubnis verarbeitet mit Dokument Intelligenz Studio:

Mehr erfahren: Identitätsdokumentmodell

Heiratsurkunde

Verwenden Sie das Modell für Heiratsurkunden, um US-Ehezertifikate zu verarbeiten und Schlüsselfelder zu extrahieren, u. a. Personen, Datum und Ort.

Beispiel für US-Heiratsurkunde, verarbeitet mit Document Intelligence Studio:

Mehr erfahren: Identitätsdokumentmodell

Kreditkarte

Verwenden Sie das Kreditkartenmodell, um Kredit- und Debitkarten zum Extrahieren von Schlüsselfeldern zu verarbeiten.

Beispielkreditkarte, verarbeitet mit Document Intelligence Studio:

Mehr erfahren: Identitätsdokumentmodell

Benutzerdefinierte Modelle

Benutzerdefinierte Modelle können allgemein in zwei Typen unterteilt werden. Benutzerdefinierte Klassifizierungsmodelle, die die Klassifizierung eines „Dokumenttyps“ unterstützen, und benutzerdefinierte Extraktionsmodelle, die ein definiertes Schema aus einem bestimmten Dokumenttyp extrahieren können.

Diagramm der Typen von benutzerdefinierten Modellen und zugeordneten Modellerstellungsmodi.

Benutzerdefinierte Dokumentmodelle analysieren und extrahieren Daten aus Formularen und Dokumenten, die für Ihr Unternehmen spezifisch sind. Sie sind darauf trainiert, Formularfelder innerhalb Ihrer unterschiedlichen Inhalte zu erkennen und Schlüssel-Wert-Paare sowie Tabellendaten zu extrahieren. Für den Anfang benötigen Sie lediglich ein Beispiel des Formulartyps.

Version v3.0 des benutzerdefinierten Modells unterstützt die Signaturerkennung in benutzerdefinierten Vorlagen (Formularen) sowie seitenübergreifende Tabellen in Vorlagenmodellen und neuronalen Modellen.

Benutzerdefinierte Beispielvorlage verarbeitet mit Dokument Intelligenz Studio:

Screenshot des Fenster „analyze-a-custom-form“ (Benutzerdefiniertes Formular analysieren) von Dokument Intelligenz

Mehr erfahren: Benutzerdefiniertes Modell

Benutzerdefinierte Extraktion

Es gibt zwei Arten von Extraktionsmodellen: Benutzerdefiniertes Vorlagenmodell oder Benutzerdefiniertes neuronales Modell. Um ein benutzerdefiniertes Extraktionsmodell zu erstellen, beschriften Sie ein Dataset von Dokumenten mit den Werten, die Sie extrahieren möchten, und trainieren das Modell für das beschriftete Dataset. Zunächst benötigen Sie lediglich fünf Beispiele desselben Formular- oder Dokumenttyps.

Benutzerdefinierter Beispielauszug verarbeitet mit Dokument Intelligenz Studio:

Screenshot der benutzerdefinierten Extraktionsmodellanalyse mit Dokument Intelligenz Studio

Weitere Informationen: Benutzerdefiniertes Vorlagenmodell

Weitere Informationen: Benutzerdefiniertes neuronales Modell

Benutzerdefinierter Klassifizierer

Das benutzerdefinierte Klassifizierungsmodell ermöglicht Ihnen, den Dokumenttyp zu identifizieren, bevor Sie das Extraktionsmodell aufrufen. Das Klassifizierungsmodell ist ab der 2023-07-31 (GA) API verfügbar. Zum Trainieren eines benutzerdefinierten Klassifizierungsmodells sind mindestens zwei verschiedene Klassen und mindestens fünf Beispiele pro Klasse erforderlich.

Weitere Informationen: Benutzerdefiniertes Klassifizierungsmodell

Zusammengesetzte Modelle

Ein zusammengestelltes Modell wird erstellt, indem eine Sammlung benutzerdefinierter Modelle verwendet und zu einem einzigen Modell zusammengesetzt wird, das auf Ihren Formulartypen basiert. In einem zusammengesetzten Modell werden verschiedene benutzerdefinierten Modelle kombiniert und dann mit einer einzigen Modell-ID aufgerufen. Sie können einem einzelnen zusammengestellten Modell bis zu 200 trainierte benutzerdefinierte Modelle zuweisen.

Dialogfeld eines zusammengesetzten Modells in Dokument Intelligenz Studio:

Screenshot des Dialogfelds für ein zusammengesetztes benutzerdefiniertes Modell in Dokument Intelligenz Studio

Mehr erfahren: Benutzerdefiniertes Modell

Eingabeanforderungen

Die besten Ergebnisse erzielen Sie, wenn Sie pro Dokument ein deutliches Foto oder einen hochwertigen Scan bereitstellen.

Unterstützte Dateiformate:

Modell	PDF	Bild: JPEG/JPG, PNG, BMP, TIFF, HEIF	Microsoft Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX) und HTML
Lesen	✔	✔	✔
Layout	✔	✔	✔ (2024-02-29-preview, 2023-10-31-preview)
Allgemeines Dokument	✔	✔
Vordefiniert	✔	✔
Benutzerdefinierte Extraktion	✔	✔
Benutzerdefinierte Klassifizierung	✔	✔	✔ (2024-02-29-preview)

In den Formaten PDF und TIFF können bis zu 2.000 Seiten verarbeitet werden (bei einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet).
Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für die kostenpflichtige (S0) und 4 MB für die kostenlose (F0) Stufe.
Die Bildgrößen müssen im Bereich zwischen 50 × 50 Pixel und 10.000 × 10.000 Pixel liegen.
Wenn Ihre PDFs kennwortgeschützt sind, müssen Sie die Sperre vor dem Senden entfernen.
Die Mindesthöhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 × 768 Pixel. Diese Abmessung entspricht etwa einem 8-Punkt-Text bei 150 Punkten pro Zoll (Dots per Inch, DPI).
Die maximale Anzahl Seiten für Trainingsdaten beträgt beim benutzerdefinierten Modelltraining 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neuronale Modell.
- Für das Training des benutzerdefinierten Extraktionsmodells beträgt die Gesamtgröße der Trainingsdaten 50 MB für das Vorlagenmodell und 1G-MB für das neuronale Modell.
- Für das Training des benutzerdefinierten Klassifizierungsmodells beträgt die Gesamtgröße der Trainingsdaten 1GB mit einem Maximum von 10 000 Seiten.

Hinweis

Das Tool für die Beschriftung von Beispielen unterstützt nicht das BMP-Dateiformat. Dies ist eine Einschränkung des Tools, nicht des Dokument Intelligenz-Diensts.

Versions-Migration

Informationen zur Verwendung von Dokument Intelligenz 3.0 in Ihren Anwendungen finden Sie im Migrationsleitfaden für Dokument Intelligenz 3.1.

Modell	Beschreibung
Dokumentanalyse
Layout	Extrahiert Text- und Layoutinformationen aus Dokumenten.
Vordefiniert
Rechnung	Extrahieren Sie Schlüsselinformationen aus englischen und spanischen Rechnungen.
Rechnung	Extrahieren Sie Schlüsselinformationen aus englischen Quittungen.
Ausweisdokument	Extrahieren von Schlüsselinformationen aus US-Führerscheinen und internationalen Pässen.
Visitenkarte	Extrahieren von Schlüsselinformationen aus englischen Visitenkarten.
Benutzerdefiniert
Benutzerdefiniert	Extrahieren Sie Daten aus Formularen und Dokumenten, die für Ihr Unternehmen spezifisch sind. Benutzerdefinierte Modelle werden speziell für Ihre individuellen Daten und Anwendungsfälle trainiert.
Zusammengestellt	Erstellt eine Sammlung benutzerdefinierter Modelle und weist sie einem einzelnen Modell zu, das aus Ihren Formulartypen erstellt wurde.

Layout

Die Layout-API analysiert und extrahiert Text, Tabellen und Kopfzeilen, Auswahlmarkierungen und Strukturinformationen aus Dokumenten.

Mithilfe des Beispielbezeichnungstools bearbeitetes Beispieldokument:

Screenshot der Analyse von „layout“ mithilfe des Bezeichnungstools für Stichproben

Mehr erfahren: Layout-Modell

Rechnung

Das Rechnungsmodell analysiert und extrahiert Schlüsselinformationen aus Verkaufsrechnungen. Die API analysiert Rechnungen in verschiedenen Formaten und extrahiert Schlüsselinformationen wie Kundenname, Rechnungsadresse, Fälligkeitsdatum und fälliger Betrag.

Mithilfe des Beispielbezeichnungstools bearbeitete Beispielrechnung:

Screenshot einer Beispielrechnungsanalyse mithilfe des Beispielbezeichnungstools.

Mehr erfahren: Rechnungsmodell

Rechnung

Das Belegmodell analysiert und extrahiert Schlüsselinformationen aus gedruckten und handschriftlichen Verkaufsbelegen (Quittungen).

Mit dem Beispielbezeichnungstool bearbeiteter Beispielbeleg:

Mehr erfahren: Eingangsmodell

ID-Dokument

Das ID-Dokumentmodell analysiert und extrahiert wichtige Informationen aus den folgenden Dokumenten:

US-Führerscheine (alle 50 Bundesstaaten und District of Columbia (D. C.))
Seiten mit persönlichen Daten aus internationalen Reisepässen (mit Ausnahme von Visa und anderen Reisedokumenten). Die API analysiert Identitätsdokumente und extrahiert

Beispiel eines mit dem Beispielbezeichnungstool bearbeiteten US-Führerscheins:

Screenshot eines Beispielausweises.

Mehr erfahren: Identitätsdokumentmodell

Visitenkarte

Das Visitenkartenmodell analysiert und extrahiert Schlüsselinformationen aus Visitenkartenbildern.

Beispiel einer mit dem Beispielbezeichnungstool bearbeiteten Visitenkarte:

Screenshot einer Beispielvisitenkarte.

Mehr erfahren: Visitenkartenmodell

Benutzerdefiniert

Benutzerdefinierte Modelle analysieren und extrahieren Daten aus Formularen und Dokumenten, die für Ihr Unternehmen spezifisch sind. Bei der API handelt es sich um ein Machine Learning-Programm, das darauf trainiert ist, Formularfelder innerhalb Ihrer unterschiedlichen Inhalte zu erkennen und Schlüssel-Wert-Paare sowie Tabellendaten zu extrahieren. Für den Einstieg benötigen Sie nur fünf Beispiele desselben Formulartyps, und Ihr benutzerdefiniertes Modell kann mit oder ohne bezeichnete Datasets trainiert werden.

Beispiel eines mit dem Beispielbezeichnungstool bearbeiteten benutzerdefinierten Modells:

Screenshot des Fenster „analyze-a-custom-form“ (Benutzerdefiniertes Formular analysieren) von Document Intelligence

Mehr erfahren: Benutzerdefiniertes Modell

Zusammengestelltes benutzerdefiniertes Modell

Ein zusammengestelltes Modell wird erstellt, indem eine Sammlung benutzerdefinierter Modelle verwendet und zu einem einzigen Modell zusammengesetzt wird, das auf Ihren Formulartypen basiert. In einem zusammengesetzten Modell werden verschiedene benutzerdefinierten Modelle kombiniert und dann mit einer einzigen Modell-ID aufgerufen. Sie können einem einzelnen zusammengestellten Modell bis zu 100 trainierte benutzerdefinierte Modelle zuweisen.

Dialogfenster eines mit dem Beispielbezeichnungstool zusammengesetzten Modells:

Screenshot des Dialogfelds für ein zusammengesetztes benutzerdefiniertes Modell in Dokument Intelligenz Studio

Mehr erfahren: Benutzerdefiniertes Modell

Extrahieren von Modelldaten

Modell	Textextraktion	Auswahlmarkierungen	Tabellen	Absätze	Absatzrollen	Schlüssel-Werte-Paare	Fields
Layout	✓	✓	✓	✓	✓
Rechnung	✓	✓	✓	✓		✓	✓
Rechnung	✓			✓			✓
Ausweisdokument	✓			✓			✓
Visitenkarte	✓			✓			✓
Benutzerdefiniertes Formular	✓	✓	✓	✓			✓

Eingabeanforderungen

Die besten Ergebnisse erzielen Sie, wenn Sie pro Dokument ein deutliches Foto oder einen hochwertigen Scan bereitstellen.

Unterstützte Dateiformate:

Modell	PDF	Bild: JPEG/JPG, PNG, BMP, TIFF, HEIF	Microsoft Office: Word (DOCX), Excel (XLSX), PowerPoint (PPTX) und HTML
Lesen	✔	✔	✔
Layout	✔	✔	✔ (2024-02-29-preview, 2023-10-31-preview)
Allgemeines Dokument	✔	✔
Vordefiniert	✔	✔
Benutzerdefinierte Extraktion	✔	✔
Benutzerdefinierte Klassifizierung	✔	✔	✔ (2024-02-29-preview)

In den Formaten PDF und TIFF können bis zu 2.000 Seiten verarbeitet werden (bei einem kostenlosen Abonnement werden nur die ersten beiden Seiten verarbeitet).
Die Dateigröße für die Analyse von Dokumenten beträgt 500 MB für die kostenpflichtige (S0) und 4 MB für die kostenlose (F0) Stufe.
Die Bildgrößen müssen im Bereich zwischen 50 × 50 Pixel und 10.000 × 10.000 Pixel liegen.
Wenn Ihre PDFs kennwortgeschützt sind, müssen Sie die Sperre vor dem Senden entfernen.
Die Mindesthöhe des zu extrahierenden Texts beträgt 12 Pixel für ein Bild von 1024 × 768 Pixel. Diese Abmessung entspricht etwa einem 8-Punkt-Text bei 150 Punkten pro Zoll (Dots per Inch, DPI).
Die maximale Anzahl Seiten für Trainingsdaten beträgt beim benutzerdefinierten Modelltraining 500 für das benutzerdefinierte Vorlagenmodell und 50.000 für das benutzerdefinierte neuronale Modell.
- Für das Training des benutzerdefinierten Extraktionsmodells beträgt die Gesamtgröße der Trainingsdaten 50 MB für das Vorlagenmodell und 1G-MB für das neuronale Modell.
- Für das Training des benutzerdefinierten Klassifizierungsmodells beträgt die Gesamtgröße der Trainingsdaten 1GB mit einem Maximum von 10 000 Seiten.

Hinweis

Das Tool für die Beschriftung von Beispielen unterstützt nicht das BMP-Dateiformat. Dies ist eine Einschränkung des Tools, nicht des Dokument Intelligenz-Diensts.

Versions-Migration

Weitere Informationen zur Verwendung von Dokument Intelligenz 3.0 in Ihren Anwendungen finden Sie im Migrationsleitfaden für Dokument Intelligenz 3.1.

Nächste Schritte

Versuchen Sie, Ihre eigenen Formulare und Dokumente mithilfe von Dokument Intelligenz Studio zu verarbeiten.
Führen Sie eine Dokument Intelligenz-Schnellstartanleitung durch, und beginnen Sie mit der Erstellung einer Anwendung zur Dokumentverarbeitung in der Entwicklungssprache Ihrer Wahl.

Versuchen Sie, Ihre eigenen Formulare und Dokumente mithilfe des Dokument Intelligenz-Stichproben-Bezeichnungstools zu verarbeiten.
Führen Sie eine Dokument Intelligenz-Schnellstartanleitung durch, und beginnen Sie mit der Erstellung einer Anwendung zur Dokumentverarbeitung in der Entwicklungssprache Ihrer Wahl.

Dokumentverarbeitungsmodelle

Übersicht über das Modell

Funktionen der Modellanalyse

Modelldetails

Read OCR

Layoutanalyse

Krankenversicherungskarte

US-Steuerdokumente

US-Hypothekendokumente

Vertrag

Rechnung

Rechnung

Identitätsdokument (ID)

Heiratsurkunde

Kreditkarte

Benutzerdefinierte Modelle

Benutzerdefinierte Extraktion

Benutzerdefinierter Klassifizierer

Zusammengesetzte Modelle

Eingabeanforderungen

Versions-Migration

Layout

Rechnung

Rechnung

ID-Dokument

Visitenkarte

Benutzerdefiniert

Zusammengestelltes benutzerdefiniertes Modell

Extrahieren von Modelldaten

Eingabeanforderungen

Versions-Migration

Nächste Schritte

Zusätzliche Ressourcen