Was ist die Azure-Formularerkennung?

Dieser Artikel gilt für:Häkchen für Formularerkennung v3.0Formularerkennung v3.0. Ältere Version:Formularerkennung v2.1

Die Azure-Formularerkennung ist ein cloudbasierter Azure Applied AI Service für Entwickler, um intelligente Lösungen für die Dokumentverarbeitung zu erstellen. Bei der Formularerkennung kommen die auf maschinellem Lernen basierende optische Zeichenerkennung (Optical Character Recognition, OCR) sowie Technologien zum besseren Dokumentverständnis zum Einsatz, um Dokumente zu klassifizieren und Text, Tabellen, Strukturen und Schlüsselwertpaare aus Dokumenten zu extrahieren. Darüber hinaus können Sie benutzerdefinierte Modelle bezeichnen und trainieren, um die Datenextraktion aus strukturierten, halbstrukturierten und unstrukturierten Dokumenten zu automatisieren. Weitere Informationen zu den einzelnen Modellen finden Sie in den Artikeln zu Konzepten:

Modelltyp Modellname
Dokumentanalysemodelle Lesen von OCR
Layout-Analyse
Allgemeines Dokument
Vordefinierte Modelle Krankenversicherungskarte
W-2-Formular
Rechnung
Beleg
Identitätsdokument (Ausweis)
Visitenkarte
Benutzerdefinierte Modelle Übersicht über benutzerdefinierte Modelle

Extraktionsmodelle
Benutzerdefinierte Vorlage
Benutzerdefiniertes neuronales Modell

Klassifizierermodell
Benutzerdefinierte Klassifizierermodell

Zusammengesetztes Modell
Eingeschränkte Vorschaumodelle

Um Zugriff auf eingeschränkte Vorschaumodelle im
Formularerkennungsstudio anzufordern, füllen Sie das
Anforderungsformular für die private Vorschau der Formularerkennung aus, und übermitteln Sie es.
Allgemeines Dokument mit Abfragefeldern
Vertrag
Impfausweis
US 1098 Steuerformular
US 1098-E Steuerformular
US 1098-T Steuerformular

Welches Formularerkennungsmodell sollte ich verwenden?

Anhand der Informationen in diesem Abschnitt können Sie entscheiden, welches der von Azure-Formularerkennung v3.0 unterstützten Modelle Sie für Ihre Anwendung verwenden sollten:

Dokumenttyp Zu extrahierende Daten Dokumentformat Für Sie am besten geeignete Lösung
Ein generisches Dokument wie ein Vertrag oder Brief. Sie möchten hauptsächlich Textzeilen, Wörter, Orte und erkannte Sprachen extrahieren. Das Dokument wird in einer unterstützten Sprache geschrieben oder gedruckt. Lese-OCR-Modell
Ein Dokument, das strukturelle Informationen wie einen Bericht oder eine Studie enthält. Zusätzlich zum Text müssen Sie Strukturinformationen wie Tabellen, Markierungen, Absätze, Titel, Überschriften und Unterüberschriften extrahieren. Das Dokument ist in einer unterstützten Sprache geschrieben oder gedruckt Layoutanalysemodell
Ein strukturiertes oder halbstrukturiertes Dokument, das Inhalte enthält, die als Felder und Werte formatiert sind, wie ein Kreditantrag oder ein Umfrageformular. Sie möchten Felder und Werte extrahieren, die nicht von den szenariospezifischen vorgefertigten Modellen abgedeckt werden, ohne ein benutzerdefiniertes Modell trainieren zu müssen. Das Formular oder Dokument ist ein standardisiertes Format, das in Ihrer Geschäfts- oder Industrie häufig verwendet wird und in einer unterstützten Sprache gedruckt wird. Allgemeines Dokumentenmodell
US W-2-Formular Sie möchten wichtige Informationen wie Gehalt, Lohn und Steuern aus US-W2-Steuerformularen extrahieren. Das W-2-Dokument ist in US-amerikanischem Englisch (en-US) verfasst. W-2-Modell
Rechnung Sie möchten wichtige Informationen wie Kundenname, Rechnungsadresse und fälligen Betrag aus Rechnungen extrahieren. Das Rechnungsdokument ist in einer unterstützten Sprache geschrieben oder gedruckt. Rechnungsmodell
Rechnung Sie möchten wichtige Informationen wie den Händlernamen, das Transaktionsdatum und die Transaktionssumme aus einem Verkaufs- oder einseitigen Hotelbeleg extrahieren. Die Quittung ist in einer unterstützten Sprache geschrieben oder gedruckt. Belegmodell
Ausweisdokument wie Reisepass oder Führerschein. Sie möchten wichtige Informationen wie Vorname, Nachname und Geburtsdatum aus US-Führerscheinen oder internationalen Pässen extrahieren. Ihr Ausweisdokument ist ein US-Führerschein oder die biografische Seite eines internationalen Reisepasses (kein Visum). Ausweisdokumentmodell
Visitenkarte Sie möchten wichtige Informationen wie Vorname, Nachname, Firmenname, E-Mail-Adresse und Telefonnummer aus Visitenkarten extrahieren. Das Visitenkarten-Dokument ist in englischem oder japanischem Text. Modell für Visitenkarten
Anwendungsspezifische Dokumente Sie möchten Schlüssel-Wert-Paare, Auswahlmarkierungen, Tabellen, Signaturfelder und ausgewählte Regionen extrahieren, die nicht von vorgefertigten oder allgemeinen Dokumentmodellen extrahiert wurden. Sie haben verschiedene Dokumente mit strukturierten, halbstrukturierten und/oder unstrukturierten Elementen. Benutzerdefiniertes Extraktionsmodell
Dokument(e) gemischter Art Sie möchten Dokumente klassifizieren oder eine Datei in einzelne Dokumente aufteilen. Sie haben verschiedene Dokumente mit strukturierten, halbstrukturierten und/oder unstrukturierten Elementen. Benutzerdefiniertes Klassifizierungsmodell

Tipp

  • Wenn Sie sich immer noch nicht sicher sind, welches Modell Sie verwenden sollen, probieren Sie das allgemeine Dokumentmodell aus, um Schlüssel-Wert-Paare zu extrahieren.
  • Das allgemeine Dokumentmodell wird von der Lese-OCR-Engine unterstützt, mit der Textlinien, Wörter, Orte und Sprachen erkannt werden können.
  • Das allgemeine Dokumentmodell extrahiert darüber hinaus dieselben Daten wie das Dokumentlayoutmodell (Seiten, Tabellen, Formatvorlagen).

Dokumentverarbeitungsmodelle und Entwicklungsoptionen

Hinweis

Die folgenden Modelle für ein besseres Dokumentverständnis und die Entwicklungsoptionen werden vom Formularerkennungsdienst v3.0 unterstützt.

Sie können die Formularerkennung verwenden, um Ihre Dokumentverarbeitung in Anwendungen und Workflows zu automatisieren, datengesteuerte Strategien zu verbessern und die Suchfunktionen für Dokumente zu erweitern. Verwenden Sie die Links in der Tabelle, um mehr über die einzelnen Modelle zu erfahren und die API-Referenzen zu durchsuchen.

Modell BESCHREIBUNG Anwendungsfälle der Automatisierung Entwicklungsoptionen
Lese-OCR-Modell Extrahieren Sie Textzeilen, Wörter, erkannte Sprachen und Handschrift, falls erkannt. ● Vertragsabwicklung.
● Verarbeitung von Finanz- oder medizinischen Berichten.
Azure-Formularerkennung Studio
REST-API
C# SDK
Python SDK
Java SDK
JavaScript
Allgemeines Dokumentenmodell Extrahieren von Text, Tabellen, Strukturen, Schlüssel-Wert-Paaren und benannten Entitäten. ● Schlüssel-Wert-Paar-Extraktion.
● Formularverarbeitung.
● Erhebung und Analyse von Umfragedaten.
Azure-Formularerkennung Studio
REST-API
C# SDK
Python SDK
Java SDK
JavaScript
Layoutanalysemodell Extrahieren von Text, Auswahlmarkierungen und Tabellenstrukturen sowie der zugehörigen Begrenzungsrahmenkoordinaten aus Formularen und Dokumenten.

Die Layout-API wurde auf ein vordefiniertes Modell aktualisiert.
● Dokumentindizierung und -abruf nach Struktur.
● Vorverarbeitung vor der OCR-Analyse.
Azure-Formularerkennung Studio
REST-API
C# SDK
Python SDK
Java SDK
JavaScript
Benutzerdefiniertes Modell (aktualisiert) Klassifizieren, Extrahieren und Analysieren von Daten aus spezifischen Formularen und Dokumenten für unterschiedliche Geschäftsdaten und Anwendungsfälle. Die benutzerdefinierte Modell-API v3.0 unterstützt zwei Modelltypen: ● Das benutzerdefinierte Klassifizierermodell wird verwendet, um Dokumenttypen zu identifizieren und aufzuteilen.
Das benutzerdefinierte Extraktionsmodell wird verwendet, um Formulare oder Dokumente zu analysieren und bestimmte Felder und Tabellen zu extrahieren. Benutzerdefinierte Vorlagen und benutzerdefinierte neuronale Vorlagen sind die beiden Typen von benutzerdefinierten Extraktionsmodellen.
● Identifizierung und Extraktion von Daten aus Dokumenten, die für Ihr Unternehmen eindeutig sind und von einer regulatorischen Änderung oder einem Marktereignis betroffen sind.
● Identifizierung und Analyse bisher übersehener eindeutiger Daten.
Azure-Formularerkennung Studio
REST-API
C# SDK
Python SDK
Java SDK
JavaScript
W-2-Formular Extrahieren von Informationen, die in jedem Kästchen in einem W-2-Formular angegeben werden. ● Automatisierte Verwaltung von Steuerdokumenten.
● Bearbeitung von Hypothekenkreditanträgen.
Azure-Formularerkennung StudioREST-API
C# SDK
Python SDK
Java SDK
JavaScript
Rechnungsmodell Automatisierte Datenverarbeitung und Extraktion von Schlüsselinformationen aus Verkaufsrechnungen ● Kreditorenbuchhaltung.
● Automatisierte Steuererfassung und -berichterstellung.
Azure-Formularerkennung Studio
REST-API
C# SDK
Python SDK
Belegmodell (aktualisiert) Automatisierte Datenverarbeitung und Extraktion wichtiger Informationen aus Verkaufsbelegen.

Das Quittungsmodell v3.0 unterstützt die Verarbeitung von
.
● Spesenverwaltung.
● Datenanalyse des Verbraucherverhaltens.
● Kundenbindungsprogramm.
● Warenrücksendungsverarbeitung.
● Automatisierte Steuererfassung und -berichterstellung.
Azure-Formularerkennung Studio
REST-API
C# SDK
Python SDK
Java SDK
JavaScript
Ausweisdokumentmodell (aktualisiert) Automatisierte Datenverarbeitung und Extraktion von Schlüsselinformationen aus US-Führerscheinen und internationalen Pässen.

Vorgefertigte ID-Dokument-API unterstützt die
.
● Einhaltung der KYC-Richtlinien (Know your customer) für Finanzdienstleistungen.
● Verwaltung medizinischer Konten.
● Identitätsprüfpunkte und Gateways.
● Hotelregistrierung.
Azure-Formularerkennung Studio
REST-API
C# SDK
Python SDK
Java SDK
JavaScript
Modell für Visitenkarten Automatisierte Datenverarbeitung und Extraktion von Schlüsselinformationen aus Visitenkarten ● Vertriebsleitung und Marketingmanagement. Azure-Formularerkennung Studio
REST-API
C# SDK
Python SDK
Java SDK
JavaScript

Dieser Artikel gilt für:Häkchen für Formularerkennung v2.1Formularerkennung v2.1. Höhere Version:Formularerkennung v3.0

Die Azure-Formularerkennung ist ein cloudbasierter Azure Applied AI Service für Entwickler, um intelligente Lösungen für die Dokumentverarbeitung zu erstellen. Bei der Formularerkennung kommen die auf maschinellem Lernen basierende optische Zeichenerkennung (OCR) sowie Technologien zum besseren Dokumentverständnis zum Einsatz, um Text, Tabellen, Strukturen und Schlüsselwertpaare aus Dokumenten zu extrahieren. Darüber hinaus können Sie benutzerdefinierte Modelle bezeichnen und trainieren, um die Datenextraktion aus strukturierten, halbstrukturierten und unstrukturierten Dokumenten zu automatisieren. Weitere Informationen zu den einzelnen Modellen finden Sie in den Artikeln zu Konzepten:

Modelltyp Modellname
Dokumentanalysemodell Layoutanalysemodell
Vordefinierte Modelle Rechnungsmodell
Belegmodell
Ausweisdokumentmodell
Visitenkartenmodell
Benutzerdefinierte Modelle Benutzerdefiniertes Modell
Zusammengesetztes Modell

Welches Dokumentverarbeitungsmodell sollte ich verwenden?

Dieser Abschnitt hilft Ihnen bei der Entscheidung, welches von Azure-Formularerkennung v2.1 unterstützte Modell Sie für Ihre Anwendung verwenden sollten:

Dokumenttyp Zu extrahierende Daten Dokumentformat Für Sie am besten geeignete Lösung
Ein Dokument, das strukturelle Informationen wie einen Bericht oder eine Studie enthält. Zusätzlich zum Text müssen Sie Strukturinformationen wie Tabellen und Auswahlmarkierungen extrahieren. Das Dokument ist in einer unterstützten Sprache geschrieben oder gedruckt Layoutanalysemodell
Rechnung Sie möchten wichtige Informationen wie Kundenname, Rechnungsadresse und fälligen Betrag aus Rechnungen extrahieren. Das Rechnungsdokument ist in einer unterstützten Sprache geschrieben oder gedruckt. Rechnungsmodell
Rechnung Sie möchten wichtige Informationen wie den Händlernamen, das Transaktionsdatum und die Transaktionssumme aus einem Verkaufs- oder einseitigen Hotelbeleg extrahieren. Die Quittung ist in einer unterstützten Sprache geschrieben oder gedruckt. Belegmodell
Ausweisdokument wie Reisepass oder Führerschein. Sie möchten wichtige Informationen wie Vorname, Nachname und Geburtsdatum aus US-Führerscheinen oder internationalen Pässen extrahieren. Ihr Ausweisdokument ist ein US-Führerschein oder die biografische Seite eines internationalen Reisepasses (kein Visum). Ausweisdokumentmodell
Visitenkarte Sie möchten wichtige Informationen wie Vorname, Nachname, Firmenname, E-Mail-Adresse und Telefonnummer aus Visitenkarten extrahieren. Das Visitenkarten-Dokument ist in englischem oder japanischem Text. Modell für Visitenkarten
Dokument(e) gemischter Art Sie möchten Schlüssel-Wert-Paare, Auswahlmarkierungen, Tabellen, Signaturfelder und ausgewählte Regionen extrahieren, die nicht von vorgefertigten oder allgemeinen Dokumentmodellen extrahiert wurden. Sie haben verschiedene Dokumente mit strukturierten, halbstrukturierten und/oder unstrukturierten Elementen. Benutzerdefiniertes Modell

Funktionen und Entwicklungsoptionen der Formularerkennung

Tipp

  • Testen Sie die Formularerkennung v3.0 Studio, um die Benutzerfreundlichkeit und die Modellqualität zu verbessern.
  • v3.0 Studio unterstützt jedes Modell, das mit in v2.1 gekennzeichneten Daten trainiert wurde.
  • Ausführliche Informationen zum Migrieren von v2.1 zu v3.0 finden Sie im API-Migrationshandbuch.

Hinweis

Die folgenden Modelle und Entwicklungsoptionen werden vom Formularerkennungsdienst v2.1 unterstützt.

Verwenden Sie die Links in der Tabelle, um mehr über die einzelnen Modelle zu erfahren und die API-Referenzen zu durchsuchen:

Modell BESCHREIBUNG Entwicklungsoptionen
Layoutanalyse Extrahieren und Analysieren von Text, Auswahlzeichen, Tabellen und Begrenzungsrahmenkoordinaten aus Formularen und Dokumenten. Azure-Formularerkennung Bezeichnungstool
REST-API
Clientbibliothek SDK
Azure-Formularerkennung Docker-Container
Benutzerdefiniertes Modell Extrahieren und Analysieren von Daten aus spezifischen Formularen und Dokumenten für unterschiedliche Geschäftsdaten und Anwendungsfälle Azure-Formularerkennung Bezeichnungstool
REST-API
Stichprobenbeschriftungstool
Azure-Formularerkennung Docker-Container
Rechnungsmodell Automatisierte Datenverarbeitung und Extraktion von Schlüsselinformationen aus Verkaufsrechnungen Azure-Formularerkennung Bezeichnungstool
REST-API
Clientbibliothek SDK
Azure-Formularerkennung Docker-Container
Belegmodell Automatisierte Datenverarbeitung und Extraktion von Schlüsselinformationen aus Verkaufsbelegen Azure-Formularerkennung Bezeichnungstool
REST-API
Clientbibliothek SDK
Azure-Formularerkennung Docker-Container
Ausweisdokumentmodell Automatisierte Datenverarbeitung und Extraktion wichtiger Informationen aus US-Führerscheinen und internationalen Pässen Azure-Formularerkennung Bezeichnungstool
REST-API
Clientbibliothek SDK
Azure-Formularerkennung Docker-Container
Modell für Visitenkarten Automatisierte Datenverarbeitung und Extraktion von Schlüsselinformationen aus Visitenkarten Azure-Formularerkennung Bezeichnungstool
REST-API
Clientbibliothek SDK
Azure-Formularerkennung Docker-Container

Datenschutz und Sicherheit

Wie bei allen KI-Diensten müssen Entwickler, die den Formularerkennungsdienst nutzen, die Microsoft-Richtlinien zu Kundendaten beachten. Weitere Informationen finden Sie auf unserer Seite Daten, Datenschutz und Sicherheit für die Formularerkennung.

Nächste Schritte