Auswählen eines Modelltyps
Azure KI Dokument Intelligenz verwendet Modelle, um die zu erwartenden Dokumente und Formulare zu beschreiben. Sie können eines der vordefinierten Modelle verwenden, wenn Sie über einen gemeinsamen Dokumenttyp verfügen, oder eigene Modelle erstellen und trainieren.
In Ihrem Umfrageunternehmen verwenden Sie viele verschiedene Umfragenformulare für unterschiedliche Kunden. Sie haben einige Felder gemeinsam, z. B. „Name des Befragten“ und „Kontaktrufnummer“, aber andere Felder sind für jedes Kundenunternehmen oder jede Partei individuell. Sie möchten auswählen, welche Modelle in Ihrer Dokument Intelligenz-Lösung verwendet werden sollen, und planen, wie Sie sie erstellen.
In dieser Lerneinheit erfahren Sie mehr über die in Azure KI Dokument Intelligenz verfügbaren vordefinierten Modelle. Zudem wird erläutert, wann Sie eigene benutzerdefinierte und zusammengesetzte Modelle erstellen sollten.
Vordefinierte Modelle
Dokumenttypen wie Rechnungen und Belege variieren in unterschiedlichen Unternehmen und Branchen, weisen jedoch ähnliche Strukturen und Schlüssel-Wert-Paare auf. Beispielsweise wird der Wert „Gesamtkosten“ wahrscheinlich auf fast allen Rechnungen angezeigt, obwohl er als „Summe“, „Gesamt“ oder anderweitig bezeichnet werden kann. Microsoft stellt mit Azure KI Dokument Intelligenz eine Reihe vordefinierter Modelle für die gängigsten Dokumenttypen bereit. Sie müssen diese Modelle nicht trainieren, und Sie können mit ihnen sehr schnell Lösungen erstellen.
Allgemeine Dokumentanalysemodelle
Drei der vordefinierten Modelle sind so konzipiert, dass sie allgemeine Dokumente behandeln und Wörter, Zeilen, Struktur und andere Informationen wie die Sprache, in der das Dokument geschrieben ist, extrahieren:
Lesen. Verwenden Sie dieses Modell, um Wörter und Zeilen aus gedruckten und handschriftlichen Dokumenten zu extrahieren. Außerdem wird die im Dokument verwendete Sprache erkannt.
Allgemeines Dokument. Verwenden Sie dieses Modell, um Schlüssel-Wert-Paare und Tabellen in Ihren Dokumenten zu extrahieren.
Layout. Verwenden Sie dieses Modell, um Text, Tabellen und Strukturinformationen aus Formularen zu extrahieren. Es kann auch Auswahlelemente wie Kontrollkästchen und Optionsfelder erkennen.
Hinweis
Die obigen Modellscreenshots zeigen Dokument Intelligenz-Modelle, die Daten in Azure KI Dokument Intelligenz Studio extrahieren.
Spezifische Dokumenttypmodelle
Die anderen vordefinierten Modelle sind jeweils für die Verarbeitung eines bestimmten und häufig verwendeten Dokumenttyps konzipiert und trainiert. Beispiele hierfür sind:
Rechnung: Verwenden Sie dieses Modell, um wichtige Informationen aus Verkaufsrechnungen in Englisch und Spanisch zu extrahieren.
Beleg. Verwenden Sie dieses Modell, um Daten aus gedruckten und handschriftlichen Belegen zu extrahieren.
W-2. Verwenden Sie dieses Modell, um Daten aus dem W-2-Steuerdeklarationsformular der US-Behörden zu extrahieren.
Ausweisdokument. Verwenden Sie dieses Modell, um Daten aus US-Führerscheinen und internationalen Pässen zu extrahieren.
Visitenkarte. Verwenden Sie dieses Modell, um Namen und Kontaktdetails aus Visitenkarten zu extrahieren.
Benutzerdefinierte Modelle
Wenn die vordefinierten Modelle nicht Ihren Anforderungen entsprechen, können Sie ein benutzerdefiniertes Modell erstellen und trainieren, um den spezifischen Dokumenttyp zu analysieren, den Benutzer*innen an Ihren Azure KI Dokument Intelligenz-Dienst senden. Die vordefinierten Modelle zur Analyse allgemeiner Dokumente können umfangreiche Informationen aus diesen Formularen extrahieren, und Sie könnten sie möglicherweise verwenden, wenn Ihre Anforderungen darin bestehen, allgemeine Daten zu erhalten. Mithilfe eines benutzerdefinierten Modells, das mit Formularen mit ähnlichen Strukturen und Schlüssel-Wert-Paaren trainiert wurde, gewinnen Sie jedoch vorhersehbarere und standardisiertere Ergebnisse aus Ihren ungewöhnlichen Formulartypen.
Um ein benutzerdefiniertes Modell zu trainieren, müssen Sie mindestens fünf Beispiele des ausgefüllten Formulars bereitstellen. Je mehr Beispiele Sie jedoch bereitstellen, desto höher ist das Konfidenzniveau der Ergebnisse, die Azure KI Dokument Intelligenz bei der Analyse der Eingabe liefert. Je unterschiedlicher Ihre Dokumente in Bezug auf Struktur und Terminologie sind, desto größer ist die Anzahl der Beispieldokumente, die Sie bereitstellen müssen, um ein zuverlässiges Modell zu trainieren. Sie können entweder ein beschriftetes Dataset bereitstellen, um die erwarteten Daten zu beschreiben, oder dem Modell ermöglichen, Schlüssel-Wert-Paare und Tabellendaten auf Basis des in den Beispielformularen gefundenen Inhalts zu identifizieren. Stellen Sie außerdem sicher, dass Ihre Trainingsformulare Beispiele enthalten, die den gesamten Bereich der möglichen Eingabe umfassen. Wenn Sie z. B. sowohl handschriftliche als auch gedruckte Einträge erwarten, beziehen Sie beide in Ihr Training ein.
Nachdem Sie ein benutzerdefiniertes Modell auf diese Weise trainiert haben, kann Azure KI Dokument Intelligenz Informationen in Ihren eindeutigen Formularen genau und vorhersehbar identifizieren.
Es gibt zwei Arten benutzerdefinierter Modelle:
- Benutzerdefinierte Vorlagenmodelle. Ein benutzerdefiniertes Vorlagenmodell ist am besten geeignet, wenn die Formulare, die Sie analysieren möchten, eine konsistente visuelle Vorlage haben. Wenn Sie alle vom Benutzer eingegebenen Daten aus den Formularen entfernen und feststellen, dass die leeren Formulare identisch sind, verwenden Sie ein benutzerdefiniertes Vorlagenmodell. Benutzerdefinierte Vorlagenmodelle unterstützen 9 verschiedene Sprachen für handschriftlichen Text und eine breite Palette von Sprachen für gedruckten Text. Wenn Sie einige unterschiedliche Variationen der Formularvorlagen haben, trainieren Sie ein Modell für jede Variante, und stellen Sie dann die Modelle in einem einzelnen Modell zusammen. Der Dienst ruft das Modell auf, das am besten für die Analyse des Dokuments geeignet ist.
- Benutzerdefinierte neuronale Modelle. Ein benutzerdefiniertes neuronales Modell kann das gesamte Spektrum von strukturierten bis zu unstrukturierten Dokumenten abdecken. Dokumente wie Verträge ohne definierte Struktur oder stark strukturierte Formulare können mit einem neuronalen Modell analysiert werden. Die Genauigkeit von neuronalen Modellen ist bei Englisch am höchsten. Bei anderen Sprachen wie Deutsch, Französisch, Italienisch, Spanisch und Niederländisch ist die Genauigkeit etwas geringer. Probieren Sie zunächst das benutzerdefinierte neuronale Modell aus, sofern das Modell für Ihr Szenario geeignet ist.
Zusammengesetzte Modelle
Ein zusammengesetztes Modell besteht aus mehreren benutzerdefinierten Modellen. Zu typischen Szenarien, in denen zusammengesetzte Modelle hilfreich sind, gehören beispielsweise Szenarien, in denen Sie den übermittelten Dokumenttyp nicht kennen und ihn klassifizieren und anschließend analysieren möchten. Sie sind auch nützlich, wenn Sie mehrere Variationen eines Formulars besitzen, jeweils mit einem trainierten individuellen Modell. Wenn ein Benutzer bzw. eine Benutzerin ein Formular an das zusammengesetzte Modell sendet, klassifiziert Dokument Intelligenz es automatisch, um zu bestimmen, welches benutzerdefinierte Modell zur Analyse verwendet werden sollten. Bei diesem Ansatz muss ein Benutzer vor der Übermittlung nicht wissen, um welche Art von Dokument es geht. Das kann hilfreich sein, wenn Sie viele ähnliche Formulare verwenden, oder wenn Sie einen einzelnen Endpunkt für alle Formulartypen veröffentlichen möchten.
Wichtig
Die Ergebnisse eines zusammengesetzten Modells umfassen die docType
-Eigenschaft, die das zum Analysieren des jeweiligen Formulars ausgewählte benutzerdefinierte Modell angibt.
Wenn Sie den Standard-Tarif verwenden, können Sie einem einzelnen zusammengesetzten Modell bis zu 100 benutzerdefinierte Modelle hinzufügen. Wenn Sie den Free-Tarif verwenden, können Sie nur bis zu 5 benutzerdefinierte Modelle hinzufügen.
Weitere Informationen
- Dokumentverarbeitungsmodelle
- Benutzerdefinierte Dokument Intelligenz-Modelle
- Zusammengestellte benutzerdefinierte Modelle