Verwenden von vorgefertigten Modellen

Abgeschlossen

Tip

Weitere Details finden Sie auf der Registerkarte "Text und Bilder ".

Vordefinierte Modelle in Azure Document Intelligence ermöglichen es Ihnen, Daten aus gängigen Formulartypen zu extrahieren, ohne ihre eigenen Modelle zu trainieren. Microsoft trainiert diese Modelle mit einer großen Anzahl von Beispieldokumenten, sodass Sie genaue und zuverlässige Ergebnisse für Standarddokumenttypen erwarten können.

Dokumentanalysemodelle

Bevor Sie sich die domänenspezifischen vordefinierten Modelle ansehen, ist es wichtig, die Dokumentanalysemodelle zu verstehen, die sie zugrunde legen.

Lesemodell

Das Lesemodell extrahiert gedruckten und handschriftlichen Text aus Dokumenten und Bildern. Sie erkennt die Sprache jeder Textzeile und klassifiziert, ob Text handschriftlich oder gedruckt wird. Das Lesemodell wird als Grundlage für die Textextraktion in allen anderen Document Intelligence-Modellen verwendet.

Bei pdf- oder TIFF-Dateien mit mehreren Seiten können Sie den pages Parameter in Ihrer Anforderung verwenden, um einen Seitenbereich für die Analyse anzugeben.

Das Lesemodell ist ideal, wenn Sie Wörter und Zeilen aus Dokumenten ohne feste oder vorhersagbare Struktur extrahieren möchten.

Screenshot des Lesemodells, das ein Beispieldokument im Document Intelligence Studio analysiert.

Layoutmodell

Das Layoutmodell erweitert die Textextraktion des Lesemodells durch Erkennung von Auswahlmarkierungen, Tabellen und Dokumentstrukturinformationen. Es unterstützt auch ein optionales keyValuePairs Feature zum Extrahieren von Schlüssel-Wert-Paaren.

Wenn Sie ein Dokument digitalisieren, ist es möglicherweise abgewinkelt, oder Tabellen weisen komplexe Strukturen mit verbundenen Zellen oder unvollständigen Zeilen auf. Das Layoutmodell kann diese Schwierigkeiten bewältigen. Jede Tabellenzelle wird mit ihrem Inhalt, der Begrenzungsrahmenposition und den Zeilen-/Spaltenindizes extrahiert.

Auswahlzeichen (Kontrollkästchen und Optionsfelder) werden mit ihrem Begrenzungsrahmen, dem Zuverlässigkeitsniveau und dem Auswahlstatus extrahiert.

Screenshot des Layoutmodells, das Tabellen und Struktur aus einem Beispieldokument im Document Intelligence Studio extrahiert.

Hinweis

Das allgemeine Dokumentmodell war in früheren Versionen von Document Intelligence verfügbar, wurde jedoch in der 2023-10-31-preview Version veraltet. Die Funktionalität für Schlüsselwertpaare und Entitätsextraktion wurde in das Layoutmodell und andere Features integriert.

Vorgefertigte Modelle für bestimmte Dokumenttypen

Azure Document Intelligence enthält vorgefertigte Modelle, die auf bestimmten Dokumenttypen trainiert wurden. Die folgenden vorgefertigten Modelle sind einige Beispiele zum Extrahieren von Feldern aus allgemeinen Geschäftsdokumenten:

Modell Beschreibung
Rechnung Extrahiert Kundenname, Lieferantendetails, Bestellnummer, Rechnung und Fälligkeitsdaten, Rechnungs- und Versandadressen, Positionen und Summen.
Beleg Extrahiert Händlerdetails, Transaktionsdatum und -uhrzeit, Positionen und Summen. Unterstützt die Verarbeitung von Einzelseiten-Hotelbestätigungen.
Kontoauszug Extrahiert Kontoinformationen, Anfangs- und Endguthaben sowie Transaktionsdetails.
Überprüfung Extrahiert Zahlungsempfänger, Betrag, Datum und andere relevante Informationen.
Lohnabrechnung Extrahiert Löhne, Stunden, Abzüge, Nettolohn und andere gängige Lohnabrechnungsfelder.
Kreditkarte Extrahiert Zahlungskarteninformationen.
Vertrag Extrahiert Vereinbarungs- und Parteidetails.

US-Steuerdokumente

Modell Beschreibung
Einheitliche US-Steuer Ein einzelnes Modell, das aus jedem unterstützten US-Steuerformulartyp extrahiert wird.
W-2 Extrahiert steuerbare Vergütungsdetails.
1098 und Variationen Extrahiert Hypothekenzinsen und zugehörige Details.
1099 und Variationen Extrahiert Einnahmen aus verschiedenen Quellen.
1040 und Variationen Extrahiert individuelle Steuererklärungsdetails.

US-Hypothekendokumente

Modell Beschreibung
1003 (URLA) Extrahiert Informationen zum Kreditantrag.
1004 (URAR) Extrahiert Informationen aus Immobilienbewertungen.
1005 Extrahiert Beschäftigungsvalidierungsinformationen.
1008 Extrahiert die Übertragungsdetails von Krediten.
Schließen der Offenlegung Extrahiert die endgültigen Abschlusskreditbedingungen.

Persönliche Identifikationsdokumente

Modell Beschreibung
Ausweisdokument Extrahiert Details aus US-Führerscheinen, IDs der Europäischen Union und Führerscheinen sowie internationalen Pässen. Enthält Namen, Geburtsdatum, Dokumentnummern und Bestätigungen oder Einschränkungen.
Krankenversicherungskarte Extrahiert allgemeine Felder aus US-Krankenversicherungskarten.
Heiratsurkunde Extrahiert zertifizierte Eheinformationen.

Von Bedeutung

Das ID-Dokumentmodell extrahiert personenbezogene Informationen, die von den Datenschutzgesetzen in den meisten Rechtsordnungen abgedeckt werden. Stellen Sie sicher, dass Sie über die Berechtigung der Person verfügen, ihre Daten zu speichern und alle geltenden gesetzlichen Anforderungen einzuhalten.

Merkmale der vordefinierten Modelle

Vorgefertigte Modelle wurden entwickelt, um verschiedene Arten von Daten aus Dokumenten zu extrahieren. Zu diesen Funktionen gehören:

  • Textextraktion: Alle vorgefertigten Modelle extrahieren Linien und Wörter aus handschriftlichem und gedruckten Text.
  • Schlüsselwertpaare: Textspannen, die eine Beschriftung und deren Antwort identifizieren. Zum Beispiel Gewicht und 31 kg.
  • Auswahlmarkierungen: Kontrollkästchen und Optionsfelder sowie die Angabe, ob sie ausgewählt sind oder nicht.
  • Tabellen: Daten in Zellen, einschließlich der Anzahl der Spalten und Zeilen, Spalten- und Zeilenüberschriften und zusammengeführten Zellen.
  • Felder: Modelle, die für einen bestimmten Formulartyp trainiert wurden, identifizieren einen festen Satz von Feldern. Das Rechnungsmodell extrahiert z. B. CustomerName und InvoiceTotal.

Gründe für die Verwendung vordefinierter und benutzerdefinierter Modelle

Vordefinierte Modelle decken die am häufigsten verwendeten Dokumenttypen ab. Wenn Sie über einen branchenspezifischen oder eindeutigen Formulartyp verfügen, erhalten Sie möglicherweise genauere Ergebnisse mit einem benutzerdefinierten Modell. Benutzerdefinierte Modelle erfordern jedoch Zeit- und Beispieldaten zum Trainieren. Überprüfen Sie immer, ob ein vordefiniertes Modell für Ihr Szenario vorhanden ist, bevor Sie in die entwicklung von benutzerdefinierten Modellen investieren.

Weitere Informationen