Verwenden von vorgefertigten Modellen
Tip
Weitere Details finden Sie auf der Registerkarte "Text und Bilder ".
Vordefinierte Modelle in Azure Document Intelligence ermöglichen es Ihnen, Daten aus gängigen Formulartypen zu extrahieren, ohne ihre eigenen Modelle zu trainieren. Microsoft trainiert diese Modelle mit einer großen Anzahl von Beispieldokumenten, sodass Sie genaue und zuverlässige Ergebnisse für Standarddokumenttypen erwarten können.
Dokumentanalysemodelle
Bevor Sie sich die domänenspezifischen vordefinierten Modelle ansehen, ist es wichtig, die Dokumentanalysemodelle zu verstehen, die sie zugrunde legen.
Lesemodell
Das Lesemodell extrahiert gedruckten und handschriftlichen Text aus Dokumenten und Bildern. Sie erkennt die Sprache jeder Textzeile und klassifiziert, ob Text handschriftlich oder gedruckt wird. Das Lesemodell wird als Grundlage für die Textextraktion in allen anderen Document Intelligence-Modellen verwendet.
Bei pdf- oder TIFF-Dateien mit mehreren Seiten können Sie den pages Parameter in Ihrer Anforderung verwenden, um einen Seitenbereich für die Analyse anzugeben.
Das Lesemodell ist ideal, wenn Sie Wörter und Zeilen aus Dokumenten ohne feste oder vorhersagbare Struktur extrahieren möchten.
Layoutmodell
Das Layoutmodell erweitert die Textextraktion des Lesemodells durch Erkennung von Auswahlmarkierungen, Tabellen und Dokumentstrukturinformationen. Es unterstützt auch ein optionales keyValuePairs Feature zum Extrahieren von Schlüssel-Wert-Paaren.
Wenn Sie ein Dokument digitalisieren, ist es möglicherweise abgewinkelt, oder Tabellen weisen komplexe Strukturen mit verbundenen Zellen oder unvollständigen Zeilen auf. Das Layoutmodell kann diese Schwierigkeiten bewältigen. Jede Tabellenzelle wird mit ihrem Inhalt, der Begrenzungsrahmenposition und den Zeilen-/Spaltenindizes extrahiert.
Auswahlzeichen (Kontrollkästchen und Optionsfelder) werden mit ihrem Begrenzungsrahmen, dem Zuverlässigkeitsniveau und dem Auswahlstatus extrahiert.
Hinweis
Das allgemeine Dokumentmodell war in früheren Versionen von Document Intelligence verfügbar, wurde jedoch in der 2023-10-31-preview Version veraltet. Die Funktionalität für Schlüsselwertpaare und Entitätsextraktion wurde in das Layoutmodell und andere Features integriert.
Vorgefertigte Modelle für bestimmte Dokumenttypen
Azure Document Intelligence enthält vorgefertigte Modelle, die auf bestimmten Dokumenttypen trainiert wurden. Die folgenden vorgefertigten Modelle sind einige Beispiele zum Extrahieren von Feldern aus allgemeinen Geschäftsdokumenten:
Finanz- und Rechtsdokumente
| Modell | Beschreibung |
|---|---|
| Rechnung | Extrahiert Kundenname, Lieferantendetails, Bestellnummer, Rechnung und Fälligkeitsdaten, Rechnungs- und Versandadressen, Positionen und Summen. |
| Beleg | Extrahiert Händlerdetails, Transaktionsdatum und -uhrzeit, Positionen und Summen. Unterstützt die Verarbeitung von Einzelseiten-Hotelbestätigungen. |
| Kontoauszug | Extrahiert Kontoinformationen, Anfangs- und Endguthaben sowie Transaktionsdetails. |
| Überprüfung | Extrahiert Zahlungsempfänger, Betrag, Datum und andere relevante Informationen. |
| Lohnabrechnung | Extrahiert Löhne, Stunden, Abzüge, Nettolohn und andere gängige Lohnabrechnungsfelder. |
| Kreditkarte | Extrahiert Zahlungskarteninformationen. |
| Vertrag | Extrahiert Vereinbarungs- und Parteidetails. |
US-Steuerdokumente
| Modell | Beschreibung |
|---|---|
| Einheitliche US-Steuer | Ein einzelnes Modell, das aus jedem unterstützten US-Steuerformulartyp extrahiert wird. |
| W-2 | Extrahiert steuerbare Vergütungsdetails. |
| 1098 und Variationen | Extrahiert Hypothekenzinsen und zugehörige Details. |
| 1099 und Variationen | Extrahiert Einnahmen aus verschiedenen Quellen. |
| 1040 und Variationen | Extrahiert individuelle Steuererklärungsdetails. |
US-Hypothekendokumente
| Modell | Beschreibung |
|---|---|
| 1003 (URLA) | Extrahiert Informationen zum Kreditantrag. |
| 1004 (URAR) | Extrahiert Informationen aus Immobilienbewertungen. |
| 1005 | Extrahiert Beschäftigungsvalidierungsinformationen. |
| 1008 | Extrahiert die Übertragungsdetails von Krediten. |
| Schließen der Offenlegung | Extrahiert die endgültigen Abschlusskreditbedingungen. |
Persönliche Identifikationsdokumente
| Modell | Beschreibung |
|---|---|
| Ausweisdokument | Extrahiert Details aus US-Führerscheinen, IDs der Europäischen Union und Führerscheinen sowie internationalen Pässen. Enthält Namen, Geburtsdatum, Dokumentnummern und Bestätigungen oder Einschränkungen. |
| Krankenversicherungskarte | Extrahiert allgemeine Felder aus US-Krankenversicherungskarten. |
| Heiratsurkunde | Extrahiert zertifizierte Eheinformationen. |
Von Bedeutung
Das ID-Dokumentmodell extrahiert personenbezogene Informationen, die von den Datenschutzgesetzen in den meisten Rechtsordnungen abgedeckt werden. Stellen Sie sicher, dass Sie über die Berechtigung der Person verfügen, ihre Daten zu speichern und alle geltenden gesetzlichen Anforderungen einzuhalten.
Merkmale der vordefinierten Modelle
Vorgefertigte Modelle wurden entwickelt, um verschiedene Arten von Daten aus Dokumenten zu extrahieren. Zu diesen Funktionen gehören:
- Textextraktion: Alle vorgefertigten Modelle extrahieren Linien und Wörter aus handschriftlichem und gedruckten Text.
- Schlüsselwertpaare: Textspannen, die eine Beschriftung und deren Antwort identifizieren. Zum Beispiel Gewicht und 31 kg.
- Auswahlmarkierungen: Kontrollkästchen und Optionsfelder sowie die Angabe, ob sie ausgewählt sind oder nicht.
- Tabellen: Daten in Zellen, einschließlich der Anzahl der Spalten und Zeilen, Spalten- und Zeilenüberschriften und zusammengeführten Zellen.
-
Felder: Modelle, die für einen bestimmten Formulartyp trainiert wurden, identifizieren einen festen Satz von Feldern. Das Rechnungsmodell extrahiert z. B.
CustomerNameundInvoiceTotal.
Gründe für die Verwendung vordefinierter und benutzerdefinierter Modelle
Vordefinierte Modelle decken die am häufigsten verwendeten Dokumenttypen ab. Wenn Sie über einen branchenspezifischen oder eindeutigen Formulartyp verfügen, erhalten Sie möglicherweise genauere Ergebnisse mit einem benutzerdefinierten Modell. Benutzerdefinierte Modelle erfordern jedoch Zeit- und Beispieldaten zum Trainieren. Überprüfen Sie immer, ob ein vordefiniertes Modell für Ihr Szenario vorhanden ist, bevor Sie in die entwicklung von benutzerdefinierten Modellen investieren.