Was ist die Azure-Formularerkennung?
Dieser Artikel gilt für:Formularerkennung v3.0. Ältere Version:Formularerkennung v2.1
Die Azure-Formularerkennung ist ein cloudbasierter Azure Applied AI Service für Entwickler, um intelligente Lösungen für die Dokumentverarbeitung zu erstellen. Bei der Formularerkennung kommen die auf maschinellem Lernen basierende optische Zeichenerkennung (Optical Character Recognition, OCR) sowie Technologien zum besseren Dokumentverständnis zum Einsatz, um Dokumente zu klassifizieren und Text, Tabellen, Strukturen und Schlüsselwertpaare aus Dokumenten zu extrahieren. Darüber hinaus können Sie benutzerdefinierte Modelle bezeichnen und trainieren, um die Datenextraktion aus strukturierten, halbstrukturierten und unstrukturierten Dokumenten zu automatisieren. Weitere Informationen zu den einzelnen Modellen finden Sie in den Artikeln zu Konzepten:
Modelltyp | Modellname |
---|---|
Dokumentanalysemodelle | ● Lesen von OCR ● Layout-Analyse ● Allgemeines Dokument |
Vordefinierte Modelle | ● Krankenversicherungskarte ● W-2-Formular ● Rechnung ● Beleg ● Identitätsdokument (Ausweis) ● Visitenkarte |
Benutzerdefinierte Modelle | ● Übersicht über benutzerdefinierte Modelle ● Extraktionsmodelle ○ Benutzerdefinierte Vorlage ○ Benutzerdefiniertes neuronales Modell ● Klassifizierermodell ○ Benutzerdefinierte Klassifizierermodell ● Zusammengesetztes Modell |
Eingeschränkte Vorschaumodelle Um Zugriff auf eingeschränkte Vorschaumodelle im Formularerkennungsstudio anzufordern, füllen Sie das Anforderungsformular für die private Vorschau der Formularerkennung aus, und übermitteln Sie es. |
● Allgemeines Dokument mit Abfragefeldern ● Vertrag ● Impfausweis ● US 1098 Steuerformular ● US 1098-E Steuerformular ● US 1098-T Steuerformular |
Welches Formularerkennungsmodell sollte ich verwenden?
Anhand der Informationen in diesem Abschnitt können Sie entscheiden, welches der von Azure-Formularerkennung v3.0 unterstützten Modelle Sie für Ihre Anwendung verwenden sollten:
Dokumenttyp | Zu extrahierende Daten | Dokumentformat | Für Sie am besten geeignete Lösung |
---|---|---|---|
Ein generisches Dokument wie ein Vertrag oder Brief. | Sie möchten hauptsächlich Textzeilen, Wörter, Orte und erkannte Sprachen extrahieren. | Das Dokument wird in einer unterstützten Sprache geschrieben oder gedruckt. | Lese-OCR-Modell |
Ein Dokument, das strukturelle Informationen wie einen Bericht oder eine Studie enthält. | Zusätzlich zum Text müssen Sie Strukturinformationen wie Tabellen, Markierungen, Absätze, Titel, Überschriften und Unterüberschriften extrahieren. | Das Dokument ist in einer unterstützten Sprache geschrieben oder gedruckt | Layoutanalysemodell |
Ein strukturiertes oder halbstrukturiertes Dokument, das Inhalte enthält, die als Felder und Werte formatiert sind, wie ein Kreditantrag oder ein Umfrageformular. | Sie möchten Felder und Werte extrahieren, die nicht von den szenariospezifischen vorgefertigten Modellen abgedeckt werden, ohne ein benutzerdefiniertes Modell trainieren zu müssen. | Das Formular oder Dokument ist ein standardisiertes Format, das in Ihrer Geschäfts- oder Industrie häufig verwendet wird und in einer unterstützten Sprache gedruckt wird. | Allgemeines Dokumentenmodell |
US W-2-Formular | Sie möchten wichtige Informationen wie Gehalt, Lohn und Steuern aus US-W2-Steuerformularen extrahieren. | Das W-2-Dokument ist in US-amerikanischem Englisch (en-US) verfasst. | W-2-Modell |
Rechnung | Sie möchten wichtige Informationen wie Kundenname, Rechnungsadresse und fälligen Betrag aus Rechnungen extrahieren. | Das Rechnungsdokument ist in einer unterstützten Sprache geschrieben oder gedruckt. | Rechnungsmodell |
Rechnung | Sie möchten wichtige Informationen wie den Händlernamen, das Transaktionsdatum und die Transaktionssumme aus einem Verkaufs- oder einseitigen Hotelbeleg extrahieren. | Die Quittung ist in einer unterstützten Sprache geschrieben oder gedruckt. | Belegmodell |
Ausweisdokument wie Reisepass oder Führerschein. | Sie möchten wichtige Informationen wie Vorname, Nachname und Geburtsdatum aus US-Führerscheinen oder internationalen Pässen extrahieren. | Ihr Ausweisdokument ist ein US-Führerschein oder die biografische Seite eines internationalen Reisepasses (kein Visum). | Ausweisdokumentmodell |
Visitenkarte | Sie möchten wichtige Informationen wie Vorname, Nachname, Firmenname, E-Mail-Adresse und Telefonnummer aus Visitenkarten extrahieren. | Das Visitenkarten-Dokument ist in englischem oder japanischem Text. | Modell für Visitenkarten |
Anwendungsspezifische Dokumente | Sie möchten Schlüssel-Wert-Paare, Auswahlmarkierungen, Tabellen, Signaturfelder und ausgewählte Regionen extrahieren, die nicht von vorgefertigten oder allgemeinen Dokumentmodellen extrahiert wurden. | Sie haben verschiedene Dokumente mit strukturierten, halbstrukturierten und/oder unstrukturierten Elementen. | Benutzerdefiniertes Extraktionsmodell |
Dokument(e) gemischter Art | Sie möchten Dokumente klassifizieren oder eine Datei in einzelne Dokumente aufteilen. | Sie haben verschiedene Dokumente mit strukturierten, halbstrukturierten und/oder unstrukturierten Elementen. | Benutzerdefiniertes Klassifizierungsmodell |
Tipp
- Wenn Sie sich immer noch nicht sicher sind, welches Modell Sie verwenden sollen, probieren Sie das allgemeine Dokumentmodell aus, um Schlüssel-Wert-Paare zu extrahieren.
- Das allgemeine Dokumentmodell wird von der Lese-OCR-Engine unterstützt, mit der Textlinien, Wörter, Orte und Sprachen erkannt werden können.
- Das allgemeine Dokumentmodell extrahiert darüber hinaus dieselben Daten wie das Dokumentlayoutmodell (Seiten, Tabellen, Formatvorlagen).
Dokumentverarbeitungsmodelle und Entwicklungsoptionen
Hinweis
Die folgenden Modelle für ein besseres Dokumentverständnis und die Entwicklungsoptionen werden vom Formularerkennungsdienst v3.0 unterstützt.
Sie können die Formularerkennung verwenden, um Ihre Dokumentverarbeitung in Anwendungen und Workflows zu automatisieren, datengesteuerte Strategien zu verbessern und die Suchfunktionen für Dokumente zu erweitern. Verwenden Sie die Links in der Tabelle, um mehr über die einzelnen Modelle zu erfahren und die API-Referenzen zu durchsuchen.
Modell | BESCHREIBUNG | Anwendungsfälle der Automatisierung | Entwicklungsoptionen |
---|---|---|---|
Lese-OCR-Modell | Extrahieren Sie Textzeilen, Wörter, erkannte Sprachen und Handschrift, falls erkannt. | ● Vertragsabwicklung. ● Verarbeitung von Finanz- oder medizinischen Berichten. |
● Azure-Formularerkennung Studio ● REST-API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Allgemeines Dokumentenmodell | Extrahieren von Text, Tabellen, Strukturen, Schlüssel-Wert-Paaren und benannten Entitäten. | ● Schlüssel-Wert-Paar-Extraktion. ● Formularverarbeitung. ● Erhebung und Analyse von Umfragedaten. |
● Azure-Formularerkennung Studio ● REST-API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Layoutanalysemodell | Extrahieren von Text, Auswahlmarkierungen und Tabellenstrukturen sowie der zugehörigen Begrenzungsrahmenkoordinaten aus Formularen und Dokumenten. Die Layout-API wurde auf ein vordefiniertes Modell aktualisiert. |
● Dokumentindizierung und -abruf nach Struktur. ● Vorverarbeitung vor der OCR-Analyse. |
● Azure-Formularerkennung Studio ● REST-API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Benutzerdefiniertes Modell (aktualisiert) | Klassifizieren, Extrahieren und Analysieren von Daten aus spezifischen Formularen und Dokumenten für unterschiedliche Geschäftsdaten und Anwendungsfälle. Die benutzerdefinierte Modell-API v3.0 unterstützt zwei Modelltypen: ● Das benutzerdefinierte Klassifizierermodell wird verwendet, um Dokumenttypen zu identifizieren und aufzuteilen. ● Das benutzerdefinierte Extraktionsmodell wird verwendet, um Formulare oder Dokumente zu analysieren und bestimmte Felder und Tabellen zu extrahieren. Benutzerdefinierte Vorlagen und benutzerdefinierte neuronale Vorlagen sind die beiden Typen von benutzerdefinierten Extraktionsmodellen. |
● Identifizierung und Extraktion von Daten aus Dokumenten, die für Ihr Unternehmen eindeutig sind und von einer regulatorischen Änderung oder einem Marktereignis betroffen sind. ● Identifizierung und Analyse bisher übersehener eindeutiger Daten. |
● Azure-Formularerkennung Studio ● REST-API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
W-2-Formular | Extrahieren von Informationen, die in jedem Kästchen in einem W-2-Formular angegeben werden. | ● Automatisierte Verwaltung von Steuerdokumenten. ● Bearbeitung von Hypothekenkreditanträgen. |
● Azure-Formularerkennung Studio● REST-API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Rechnungsmodell | Automatisierte Datenverarbeitung und Extraktion von Schlüsselinformationen aus Verkaufsrechnungen | ● Kreditorenbuchhaltung. ● Automatisierte Steuererfassung und -berichterstellung. |
● Azure-Formularerkennung Studio ● REST-API ● C# SDK ● Python SDK |
Belegmodell (aktualisiert) | Automatisierte Datenverarbeitung und Extraktion wichtiger Informationen aus Verkaufsbelegen. Das Quittungsmodell v3.0 unterstützt die Verarbeitung von . |
● Spesenverwaltung. ● Datenanalyse des Verbraucherverhaltens. ● Kundenbindungsprogramm. ● Warenrücksendungsverarbeitung. ● Automatisierte Steuererfassung und -berichterstellung. |
● Azure-Formularerkennung Studio ● REST-API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Ausweisdokumentmodell (aktualisiert) | Automatisierte Datenverarbeitung und Extraktion von Schlüsselinformationen aus US-Führerscheinen und internationalen Pässen. Vorgefertigte ID-Dokument-API unterstützt die . |
● Einhaltung der KYC-Richtlinien (Know your customer) für Finanzdienstleistungen. ● Verwaltung medizinischer Konten. ● Identitätsprüfpunkte und Gateways. ● Hotelregistrierung. |
● Azure-Formularerkennung Studio ● REST-API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Modell für Visitenkarten | Automatisierte Datenverarbeitung und Extraktion von Schlüsselinformationen aus Visitenkarten | ● Vertriebsleitung und Marketingmanagement. | ● Azure-Formularerkennung Studio ● REST-API ● C# SDK ● Python SDK ● Java SDK ● JavaScript |
Dieser Artikel gilt für:Formularerkennung v2.1. Höhere Version:Formularerkennung v3.0
Die Azure-Formularerkennung ist ein cloudbasierter Azure Applied AI Service für Entwickler, um intelligente Lösungen für die Dokumentverarbeitung zu erstellen. Bei der Formularerkennung kommen die auf maschinellem Lernen basierende optische Zeichenerkennung (OCR) sowie Technologien zum besseren Dokumentverständnis zum Einsatz, um Text, Tabellen, Strukturen und Schlüsselwertpaare aus Dokumenten zu extrahieren. Darüber hinaus können Sie benutzerdefinierte Modelle bezeichnen und trainieren, um die Datenextraktion aus strukturierten, halbstrukturierten und unstrukturierten Dokumenten zu automatisieren. Weitere Informationen zu den einzelnen Modellen finden Sie in den Artikeln zu Konzepten:
Modelltyp | Modellname |
---|---|
Dokumentanalysemodell | ● Layoutanalysemodell |
Vordefinierte Modelle | ● Rechnungsmodell ● Belegmodell ● Ausweisdokumentmodell ● Visitenkartenmodell |
Benutzerdefinierte Modelle | ● Benutzerdefiniertes Modell ● Zusammengesetztes Modell |
Welches Dokumentverarbeitungsmodell sollte ich verwenden?
Dieser Abschnitt hilft Ihnen bei der Entscheidung, welches von Azure-Formularerkennung v2.1 unterstützte Modell Sie für Ihre Anwendung verwenden sollten:
Dokumenttyp | Zu extrahierende Daten | Dokumentformat | Für Sie am besten geeignete Lösung |
---|---|---|---|
Ein Dokument, das strukturelle Informationen wie einen Bericht oder eine Studie enthält. | Zusätzlich zum Text müssen Sie Strukturinformationen wie Tabellen und Auswahlmarkierungen extrahieren. | Das Dokument ist in einer unterstützten Sprache geschrieben oder gedruckt | Layoutanalysemodell |
Rechnung | Sie möchten wichtige Informationen wie Kundenname, Rechnungsadresse und fälligen Betrag aus Rechnungen extrahieren. | Das Rechnungsdokument ist in einer unterstützten Sprache geschrieben oder gedruckt. | Rechnungsmodell |
Rechnung | Sie möchten wichtige Informationen wie den Händlernamen, das Transaktionsdatum und die Transaktionssumme aus einem Verkaufs- oder einseitigen Hotelbeleg extrahieren. | Die Quittung ist in einer unterstützten Sprache geschrieben oder gedruckt. | Belegmodell |
Ausweisdokument wie Reisepass oder Führerschein. | Sie möchten wichtige Informationen wie Vorname, Nachname und Geburtsdatum aus US-Führerscheinen oder internationalen Pässen extrahieren. | Ihr Ausweisdokument ist ein US-Führerschein oder die biografische Seite eines internationalen Reisepasses (kein Visum). | Ausweisdokumentmodell |
Visitenkarte | Sie möchten wichtige Informationen wie Vorname, Nachname, Firmenname, E-Mail-Adresse und Telefonnummer aus Visitenkarten extrahieren. | Das Visitenkarten-Dokument ist in englischem oder japanischem Text. | Modell für Visitenkarten |
Dokument(e) gemischter Art | Sie möchten Schlüssel-Wert-Paare, Auswahlmarkierungen, Tabellen, Signaturfelder und ausgewählte Regionen extrahieren, die nicht von vorgefertigten oder allgemeinen Dokumentmodellen extrahiert wurden. | Sie haben verschiedene Dokumente mit strukturierten, halbstrukturierten und/oder unstrukturierten Elementen. | Benutzerdefiniertes Modell |
Funktionen und Entwicklungsoptionen der Formularerkennung
Tipp
- Testen Sie die Formularerkennung v3.0 Studio, um die Benutzerfreundlichkeit und die Modellqualität zu verbessern.
- v3.0 Studio unterstützt jedes Modell, das mit in v2.1 gekennzeichneten Daten trainiert wurde.
- Ausführliche Informationen zum Migrieren von v2.1 zu v3.0 finden Sie im API-Migrationshandbuch.
Hinweis
Die folgenden Modelle und Entwicklungsoptionen werden vom Formularerkennungsdienst v2.1 unterstützt.
Verwenden Sie die Links in der Tabelle, um mehr über die einzelnen Modelle zu erfahren und die API-Referenzen zu durchsuchen:
Modell | BESCHREIBUNG | Entwicklungsoptionen |
---|---|---|
Layoutanalyse | Extrahieren und Analysieren von Text, Auswahlzeichen, Tabellen und Begrenzungsrahmenkoordinaten aus Formularen und Dokumenten. | ● Azure-Formularerkennung Bezeichnungstool ● REST-API ● Clientbibliothek SDK ● Azure-Formularerkennung Docker-Container |
Benutzerdefiniertes Modell | Extrahieren und Analysieren von Daten aus spezifischen Formularen und Dokumenten für unterschiedliche Geschäftsdaten und Anwendungsfälle | ● Azure-Formularerkennung Bezeichnungstool ● REST-API ● Stichprobenbeschriftungstool ● Azure-Formularerkennung Docker-Container |
Rechnungsmodell | Automatisierte Datenverarbeitung und Extraktion von Schlüsselinformationen aus Verkaufsrechnungen | ● Azure-Formularerkennung Bezeichnungstool ● REST-API ● Clientbibliothek SDK ● Azure-Formularerkennung Docker-Container |
Belegmodell | Automatisierte Datenverarbeitung und Extraktion von Schlüsselinformationen aus Verkaufsbelegen | ● Azure-Formularerkennung Bezeichnungstool ● REST-API ● Clientbibliothek SDK ● Azure-Formularerkennung Docker-Container |
Ausweisdokumentmodell | Automatisierte Datenverarbeitung und Extraktion wichtiger Informationen aus US-Führerscheinen und internationalen Pässen | ● Azure-Formularerkennung Bezeichnungstool ● REST-API ● Clientbibliothek SDK ● Azure-Formularerkennung Docker-Container |
Modell für Visitenkarten | Automatisierte Datenverarbeitung und Extraktion von Schlüsselinformationen aus Visitenkarten | ● Azure-Formularerkennung Bezeichnungstool ● REST-API ● Clientbibliothek SDK ● Azure-Formularerkennung Docker-Container |
Datenschutz und Sicherheit
Wie bei allen KI-Diensten müssen Entwickler, die den Formularerkennungsdienst nutzen, die Microsoft-Richtlinien zu Kundendaten beachten. Weitere Informationen finden Sie auf unserer Seite Daten, Datenschutz und Sicherheit für die Formularerkennung.
Nächste Schritte
Versuchen Sie, Ihre eigenen Formulare und Dokumente mithilfe von Formularerkennungsstudio zu verarbeiten.
Führen Sie einen Schnellstart für die Formularerkennung durch und beginnen Sie mit der Erstellung einer Anwendung zur Dokumentverarbeitung in der Entwicklungssprache Ihrer Wahl.
Lernen Sie, wie Sie Ihre eigenen Formulare und Dokumente mit dem Beispielbezeichnungstool der Formularerkennung verarbeiten können.
Führen Sie einen Schnellstart für die Formularerkennung durch und beginnen Sie mit der Erstellung einer Anwendung zur Dokumentverarbeitung in der Entwicklungssprache Ihrer Wahl.