Was ist die Azure-Formularerkennung?

Dieser Artikel gilt für:Häkchen für Formularerkennung v3.0Formularerkennung v3.0. Ältere Version:Formularerkennung v2.1

Die Azure-Formularerkennung ist ein cloudbasierter Azure Applied AI Service für Entwickler, um intelligente Lösungen für die Dokumentverarbeitung zu erstellen. Bei der Formularerkennung kommen die auf maschinellem Lernen basierende optische Zeichenerkennung (OCR) sowie Technologien zum besseren Dokumentverständnis zum Einsatz, um druck- und handschriftlichen Text, Tabellen, Strukturen und Schlüsselwertpaare aus Dokumenten zu extrahieren. Darüber hinaus können Sie benutzerdefinierte Modelle bezeichnen und trainieren, um die Datenextraktion aus strukturierten, halbstrukturierten und unstrukturierten Dokumenten zu automatisieren. Weitere Informationen zu den einzelnen Modellen finden Sie in den Artikeln zu Konzepten:

Modelltyp Modellname
Dokumentanalysemodelle OCR-Lesemodell
Allgemeines Dokumentmodell
Layoutanalysemodell
Vordefinierte Modelle W-2 Formularmodell
Rechnungsmodell
Belegmodell
Ausweisdokumentmodell
Visitenkartenmodell
Benutzerdefinierte Modelle Benutzerdefiniertes Modell
Zusammengesetztes Modell

Welches Formularerkennungsmodell sollte ich verwenden?

Dieser Abschnitt hilft Ihnen bei der Entscheidung, welches von Formularerkennung v3.0 unterstützte Modell Sie für Ihre Anwendung verwenden sollten:

Dokumenttyp Zu extrahierende Daten Dokumentformat Für Sie am besten geeignete Lösung
Ein generisches Dokument wie ein Vertrag oder Brief. Sie möchten hauptsächlich Textzeilen, Wörter, Orte und erkannte Sprachen extrahieren. Das Dokument wird in einer unterstützten Sprache geschrieben oder gedruckt. Lese-OCR-Modell
Ein Dokument, das strukturelle Informationen wie einen Bericht oder eine Studie enthält. Zusätzlich zum Text müssen Sie Strukturinformationen wie Tabellen, Markierungen, Absätze, Titel, Überschriften und Unterüberschriften extrahieren. Das Dokument ist in einer unterstützten Sprache geschrieben oder gedruckt Layoutanalysemodell
Ein strukturiertes oder halbstrukturiertes Dokument, das Inhalte enthält, die als Felder und Werte formatiert sind, wie ein Kreditantrag oder ein Umfrageformular. Sie möchten Felder und Werte extrahieren, die nicht von den szenariospezifischen vorgefertigten Modellen abgedeckt werden, ohne ein benutzerdefiniertes Modell trainieren zu müssen. Das Formular oder Dokument ist ein standardisiertes Format, das in Ihrer Geschäfts- oder Industrie häufig verwendet wird und in einer unterstützten Sprache gedruckt wird. Allgemeines Dokumentenmodell
US W-2-Formular Sie möchten wichtige Informationen wie Gehalt, Lohn und Steuern aus US-W2-Steuerformularen extrahieren. Das W-2-Dokument ist in US-amerikanischem Englisch (en-US) verfasst. W-2-Modell
Rechnung Sie möchten wichtige Informationen wie Kundenname, Rechnungsadresse und fälligen Betrag aus Rechnungen extrahieren. Das Rechnungsdokument ist in einer unterstützten Sprache geschrieben oder gedruckt. Rechnungsmodell
Rechnung Sie möchten wichtige Informationen wie den Händlernamen, das Transaktionsdatum und die Transaktionssumme aus einem Verkaufs- oder einseitigen Hotelbeleg extrahieren. Die Quittung ist in einer unterstützten Sprache geschrieben oder gedruckt. Belegmodell
Ausweisdokument wie Reisepass oder Führerschein. Sie möchten wichtige Informationen wie Vorname, Nachname und Geburtsdatum aus US-Führerscheinen oder internationalen Pässen extrahieren. Ihr Ausweisdokument ist ein US-Führerschein oder die biografische Seite eines internationalen Reisepasses (kein Visum). Ausweisdokumentmodell
Visitenkarte Sie möchten wichtige Informationen wie Vorname, Nachname, Firmenname, E-Mail-Adresse und Telefonnummer aus Visitenkarten extrahieren. Das Visitenkarten-Dokument ist in englischem oder japanischem Text. Modell für Visitenkarten
Dokument(e) gemischter Art Sie möchten Schlüssel-Wert-Paare, Auswahlmarkierungen, Tabellen, Signaturfelder und ausgewählte Regionen extrahieren, die nicht von vorgefertigten oder allgemeinen Dokumentmodellen extrahiert wurden. Sie haben verschiedene Dokumente mit strukturierten, halbstrukturierten und/oder unstrukturierten Elementen. Benutzerdefiniertes Modell

Tipp

  • Wenn Sie sich immer noch nicht sicher sind, welches Modell Sie verwenden sollen, probieren Sie das allgemeine Dokumentmodell aus, um Schlüssel-Wert-Paare zu extrahieren.
  • Das allgemeine Dokumentmodell wird von der Lese-OCR-Engine unterstützt, mit der Textlinien, Wörter, Orte und Sprachen erkannt werden können.
  • Das allgemeine Dokumentmodell extrahiert darüber hinaus dieselben Daten wie das Dokumentlayoutmodell (Seiten, Tabellen, Formatvorlagen).

Dokumentverarbeitungsmodelle und Entwicklungsoptionen

Hinweis

Die folgenden Modelle für ein besseres Dokumentverständnis und die Entwicklungsoptionen werden vom Formularerkennungsdienst v3.0 unterstützt.

Sie können die Formularerkennung verwenden, um Ihre Dokumentverarbeitung in Anwendungen und Workflows zu automatisieren, datengesteuerte Strategien zu verbessern und die Suchfunktionen für Dokumente zu erweitern. Verwenden Sie die Links in der Tabelle, um mehr über die einzelnen Modelle zu erfahren und die API-Referenzen zu durchsuchen.

Modell BESCHREIBUNG Anwendungsfälle der Automatisierung Entwicklungsoptionen
Lese-OCR-Modell Extrahieren Sie Textzeilen, Wörter, erkannte Sprachen und Handschrift, falls erkannt.
  • Vertragsabwicklung.
  • Verarbeitung von Finanz- oder medizinischen Berichten.
Allgemeines Dokumentenmodell Extrahieren von Text, Tabellen, Strukturen, Schlüssel-Wert-Paaren und benannten Entitäten.
  • Extraktion von Schlüssel-Wert-Paaren.
  • Formularverarbeitung.
  • Erfassung und Analyse von Umfragedaten.
Layoutanalysemodell Extrahieren von Text, Auswahlmarkierungen und Tabellenstrukturen sowie der zugehörigen Begrenzungsrahmenkoordinaten aus Formularen und Dokumenten.

Die Layout-API wurde auf ein vordefiniertes Modell aktualisiert.
  • Indizierung und Abruf von Dokumenten nach Struktur.
  • Vorverarbeitung vor der OCR-Analyse.
Benutzerdefiniertes Modell (aktualisiert) Extraktion und Analyse von Daten aus Formularen und Dokumenten, die für bestimmte Geschäftsdaten und Anwendungsfälle spezifisch sind.

Benutzerdefinierte Modell-API v3.0 unterstützt Signaturerkennung für benutzerdefinierte Vorlagenmodelle (benutzerdefinierte Formulare).

Benutzerdefinierte Modell-API v3.0 unterstützt jetzt zwei Modelltypen:
  • Identifizierung und Zusammenstellung von Daten, die für Ihr Unternehmen einzigartig sind und von einer regulatorischen Änderung oder einem Marktereignis betroffen sind.
  • Identifizierung und Analyse bisher übersehener eindeutiger Daten.
Formularerkennung Studio
  • REST-API
  • C# SDK
  • Python SDK
  • Java SDK
  • JavaScript
  • W-2-Formular Extrahieren von Informationen, die in jedem Kästchen in einem W-2-Formular angegeben werden.
    • Automatisierte Verwaltung von Steuerdokumenten.
    • Bearbeitung von Hypothekendarlehensanträgen.
    Rechnungsmodell Automatisierte Datenverarbeitung und Extraktion von Schlüsselinformationen aus Verkaufsrechnungen
    • Kreditorenbuchhaltung.
    • Automatisierte Steuererfassung und -berichterstattung.
    Belegmodell (aktualisiert) Automatisierte Datenverarbeitung und Extraktion wichtiger Informationen aus Verkaufsbelegen.

    Das Quittungsmodell v3.0 unterstützt die Verarbeitung von
    .
    • Kostenmanagement.
    • Datenanalyse des Verbraucherverhaltens.
    • Kundenbindungsprogramm.
    • Abwicklung von Warenrücksendungen.
    • Automatisierte Steuererfassung und -berichterstattung.
    Ausweisdokumentmodell (aktualisiert) Automatisierte Datenverarbeitung und Extraktion von Schlüsselinformationen aus US-Führerscheinen und internationalen Pässen.

    Vorgefertigte ID-Dokument-API unterstützt die
    .
    • Kennen Sie die Einhaltung der Finanzdienstleistungsrichtlinien Ihres Kunden (KYC).
    • Verwaltung medizinischer Konten.
    • Identitätsprüfpunkte und Gateways.
    • Hotelregistrierung.
    Modell für Visitenkarten Automatisierte Datenverarbeitung und Extraktion von Schlüsselinformationen aus Visitenkarten
    • Vertriebsleitung und Marketingmanagement.

    Dieser Artikel gilt für:Häkchen für Formularerkennung v2.1Formularerkennung v2.1. Höhere Version:Formularerkennung v3.0

    Die Azure-Formularerkennung ist ein cloudbasierter Azure Applied AI Service für Entwickler, um intelligente Lösungen für die Dokumentverarbeitung zu erstellen. Bei der Formularerkennung kommen die auf maschinellem Lernen basierende optische Zeichenerkennung (OCR) sowie Technologien zum besseren Dokumentverständnis zum Einsatz, um druck- und handschriftlichen Text, Tabellen, Strukturen und Schlüsselwertpaare aus Dokumenten zu extrahieren. Darüber hinaus können Sie benutzerdefinierte Modelle bezeichnen und trainieren, um die Datenextraktion aus strukturierten, halbstrukturierten und unstrukturierten Dokumenten zu automatisieren. Weitere Informationen zu den einzelnen Modellen finden Sie in den Artikeln zu Konzepten:

    Modelltyp Modellname
    Dokumentanalysemodell Layoutanalysemodell
    Vordefinierte Modelle Rechnungsmodell
    Belegmodell
    Ausweisdokumentmodell
    Visitenkartenmodell
    Benutzerdefinierte Modelle Benutzerdefiniertes Modell
    Zusammengesetztes Modell

    Welches Dokumentverarbeitungsmodell sollte ich verwenden?

    Dieser Abschnitt hilft Ihnen bei der Entscheidung, welches von Formularerkennung v2.1 unterstützte Modell Sie für Ihre Anwendung verwenden sollten:

    Dokumenttyp Zu extrahierende Daten Dokumentformat Für Sie am besten geeignete Lösung
    Ein Dokument, das strukturelle Informationen wie einen Bericht oder eine Studie enthält. Zusätzlich zum Text müssen Sie Strukturinformationen wie Tabellen und Auswahlmarkierungen extrahieren. Das Dokument ist in einer unterstützten Sprache geschrieben oder gedruckt Layoutanalysemodell
    Rechnung Sie möchten wichtige Informationen wie Kundenname, Rechnungsadresse und fälligen Betrag aus Rechnungen extrahieren. Das Rechnungsdokument ist in einer unterstützten Sprache geschrieben oder gedruckt. Rechnungsmodell
    Rechnung Sie möchten wichtige Informationen wie den Händlernamen, das Transaktionsdatum und die Transaktionssumme aus einem Verkaufs- oder einseitigen Hotelbeleg extrahieren. Die Quittung ist in einer unterstützten Sprache geschrieben oder gedruckt. Belegmodell
    Ausweisdokument wie Reisepass oder Führerschein. Sie möchten wichtige Informationen wie Vorname, Nachname und Geburtsdatum aus US-Führerscheinen oder internationalen Pässen extrahieren. Ihr Ausweisdokument ist ein US-Führerschein oder die biografische Seite eines internationalen Reisepasses (kein Visum). Ausweisdokumentmodell
    Visitenkarte Sie möchten wichtige Informationen wie Vorname, Nachname, Firmenname, E-Mail-Adresse und Telefonnummer aus Visitenkarten extrahieren. Das Visitenkarten-Dokument ist in englischem oder japanischem Text. Modell für Visitenkarten
    Dokument(e) gemischter Art Sie möchten Schlüssel-Wert-Paare, Auswahlmarkierungen, Tabellen, Signaturfelder und ausgewählte Regionen extrahieren, die nicht von vorgefertigten oder allgemeinen Dokumentmodellen extrahiert wurden. Sie haben verschiedene Dokumente mit strukturierten, halbstrukturierten und/oder unstrukturierten Elementen. Benutzerdefiniertes Modell

    Funktionen und Entwicklungsoptionen der Formularerkennung

    Tipp

    • Testen Sie die Formularerkennung v3.0 Studio, um die Benutzerfreundlichkeit und die Modellqualität zu verbessern.
    • v3.0 Studio unterstützt jedes Modell, das mit in v2.1 gekennzeichneten Daten trainiert wurde.
    • Ausführliche Informationen zum Migrieren von v2.1 zu v3.0 finden Sie im API-Migrationshandbuch.

    Hinweis

    Die folgenden Modelle und Entwicklungsoptionen werden vom Formularerkennungsdienst v2.1 unterstützt.

    Verwenden Sie die Links in der Tabelle, um mehr über die einzelnen Modelle zu erfahren und die API-Referenzen zu durchsuchen:

    Modell BESCHREIBUNG Entwicklungsoptionen
    Layoutanalyse Extrahieren und Analysieren von Text, Auswahlzeichen, Tabellen und Begrenzungsrahmenkoordinaten aus Formularen und Dokumenten.
    Benutzerdefiniertes Modell Extrahieren und Analysieren von Daten aus spezifischen Formularen und Dokumenten für unterschiedliche Geschäftsdaten und Anwendungsfälle
    Rechnungsmodell Automatisierte Datenverarbeitung und Extraktion von Schlüsselinformationen aus Verkaufsrechnungen
    Belegmodell Automatisierte Datenverarbeitung und Extraktion von Schlüsselinformationen aus Verkaufsbelegen
    Ausweisdokumentmodell Automatisierte Datenverarbeitung und Extraktion wichtiger Informationen aus US-Führerscheinen und internationalen Pässen
    Modell für Visitenkarten Automatisierte Datenverarbeitung und Extraktion von Schlüsselinformationen aus Visitenkarten

    Datenschutz und Sicherheit

    Wie bei allen KI-Diensten müssen Entwickler, die den Formularerkennungsdienst nutzen, die Microsoft-Richtlinien zu Kundendaten beachten. Weitere Informationen finden Sie auf unserer Seite Daten, Datenschutz und Sicherheit für die Formularerkennung.

    Nächste Schritte