Benutzerdefinierte zusammengesetzte Dokument Intelligenz-Modelle
Wichtig
- Public Preview-Releases von Dokument Intelligenz bieten frühzeitigen Zugriff auf Features, die sich in der aktiven Entwicklung befinden. Features, Ansätze und Prozesse können sich aufgrund von Benutzerfeedback vor der allgemeinen Verfügbarkeit (General Availability, GA) ändern.
- Die Public Preview von Dokument Intelligenz-Clientbibliotheken verwendet standardmäßig Version 2024-07-31-preview der REST-API.
- Die Public Preview 2024-07-31-preview ist derzeit lediglich in den folgenden Azure-Regionen verfügbar. Beachten Sie, dass das benutzerdefinierte generative Modell (Dokumentfeldextraktion) in KI Studio nur in der Region „USA, Norden-Mitte“ verfügbar ist:
- USA, Osten
- USA, Westen 2
- Europa, Westen
- USA Nord Mitte
Dieser Inhalt gilt für: Version 4.0 (Vorschau) | Vorherige Versionen: Version 3.1 (GA) Version 3.0 (GA) Version 2.1 (GA)
Dieser Inhalt gilt für: Version 3.1 (GA) | Aktuelle Version: Version 4.0 (Vorschau) | Vorherige Versionen: Version 3.0 Version 2.1
Dieser Inhalt gilt für: Version 3.0 (GA) | Aktuelle Versionen: Version 4.0 (Vorschau) Version 3.1 | Vorherige Version: Version 2.1
Dieser Inhalt gilt für: Version 2.1 | Neueste Version: Version 4.0 (Vorschau)
Wichtig
Das model compose
-Vorgangsverhalten ändert sich ab „api-version=2024-07-31-preview“. Der model compose
-Vorgang in v4.0 und höheren Versionen fügt einen explizit trainierten Klassifizierer anstelle eines impliziten Klassifizierers für die Analyse hinzu. Informationen zur vorherigen Version für zusammengesetzte Modelle finden Sie unter Zusammengesetzte Modelle in v3.1. Wenn Sie derzeit zusammengesetzte Modelle verwenden, sollten Sie ein Upgrade auf die neueste Implementierung in Betracht ziehen.
Was ist ein zusammengesetztes Modell?
Mit zusammengesetzten Modellen können Sie mehrere benutzerdefinierte Modelle in ein zusammengesetztes Modell gruppieren, das mit einer einzelnen Modell-ID aufgerufen wird. Ihr zusammengesetztes Modell kann z. B. benutzerdefinierte Modelle einschließen, die trainiert wurden, um Ihre Bestellungsdokumente für Material, Ausrüstung und Möbel zu analysieren. Anstatt das entsprechende Modell manuell auszuwählen, können Sie ein zusammengesetztes Modell verwenden, um das zutreffende benutzerdefinierte Modell für jede Analyse und Extraktion zu bestimmen.
Einige Szenarios erfordern zuerst die Klassifizierung des Dokuments und dann die Analyse des Dokuments mit dem Modell, das am besten geeignet ist, um die Felder aus dem Modell zu extrahieren. Solche Szenarios können Fälle umfassen, in denen ein Benutzer ein Dokument hochlädt, der Dokumenttyp jedoch nicht explizit bekannt ist. Ein weiteres Szenario besteht darin,dass mehrere Dokumente in einer einzigen Datei gescannt werden und die Datei zur Verarbeitung übermittelt wird. Ihre Anwendung muss dann die Komponentendokumente identifizieren und das beste Modell für jedes Dokument auswählen.
In früheren Versionen hat der model compose
-Vorgang eine implizite Klassifizierung durchgeführt, um zu entscheiden, welches benutzerdefinierte Modell das übermittelte Dokument am besten darstellt. Die 2024-07-31-preview
-Implementierung des model compose
-Vorgangs ersetzt die implizite Klassifizierung aus den früheren Versionen durch einen expliziten Klassifizierungsschritt und fügt bedingtes Routing hinzu.
Vorteile des neuen Modellzusammensetzungsvorgangs
Der neue model compose
-Vorgang erfordert, dass Sie einen expliziten Klassifizierer trainieren. Der Vorgang bietet mehrere Vorteile.
Kontinuierliche inkrementelle Verbesserung: Sie können die Qualität des Klassifizierers konsistent verbessern, indem Sie weitere Beispiele hinzufügen und die Klassifizierung inkrementell verbessern. Durch diese Optimierung wird sichergestellt, dass Ihre Dokumente immer an das richtige Modell zur Extraktion weitergeleitet werden.
Vollständige Kontrolle über Routing: Durch das Hinzufügen des konfidenzbasierten Routings stellen Sie einen Konfidenzschwellenwert für den Dokumenttyp und die Klassifizierungsantwort bereit.
Ignorieren dokumentspezifischer Dokumenttypen während des Vorgangs: Bei früheren Implementierungen des
model compose
-Vorgangs wurde das beste Analysemodell für die Extraktion basierend auf der Konfidenzbewertung ausgewählt, auch wenn die höchsten Konfidenzbewertungen relativ niedrig waren. Wenn Sie einen Konfidenzschwellenwert angeben oder einen bekannten Dokumenttyp aus der Klassifizierung nicht explizit einem Extraktionsmodell zuordnen, können Sie bestimmte Dokumenttypen ignorieren.Analysieren mehrerer Instanzen desselben Dokumenttyps: Bei der Kombination mit der
splitMode
-Option des Klassifizierers kann dermodel compose
-Vorgang mehrere Instanzen desselben Dokuments in einer Datei erkennen und die Datei aufteilen, um die Dokumente unabhängig voneinander zu verarbeiten. Die Verwendung vonsplitMode
ermöglicht die Verarbeitung mehrerer Instanzen eines Dokuments in einer einzigen Anforderung.Unterstützung für Add-On-Features: Add-On-Features wie Abfragefelder oder Barcodes können auch als Teil der Analysemodellparameter angegeben werden.
Erweiterung auf bis zu 500 zugewiesene benutzerdefinierte Modelle: Mit der neuen Implementierung des
model compose
-Vorgangs können Sie einem einzelnen zusammengesetzten Modell bis zu 500 trainierte benutzerdefinierte Modelle zuweisen.
Verwenden von „model compose“
Beginnen Sie mit dem Sammeln von Stichproben aus allen benötigten Dokumenten (einschließlich Stichproben mit Informationen, die extrahiert oder ignoriert werden sollen).
Trainieren Sie einen Klassifizierer, indem Sie die Dokumente in Ordnern organisieren, bei denen die Ordnernamen dem Dokumenttyp entsprechen, den Sie in Ihrer Definition für zusammengesetzte Modelle verwenden möchten.
Trainieren Sie schließlich ein Extraktionsmodell für die einzelnen Dokumenttypen, die Sie verwenden möchten.
Nachdem Ihre Klassifizierungs- und Extraktionsmodelle trainiert wurden, verwenden Sie Document Intelligence Studio, Clientbibliotheken oder die REST-API, um die Klassifizierungs- und Extraktionsmodelle in einem zusammengesetzten Modell zu kombinieren.
Verwenden Sie den splitMode
-Parameter, um das Dateiaufteilungsverhalten zu steuern:
- Keine. Die gesamte Datei wird als einzelnes Dokument behandelt.
- perPage: Jede Seite in der Datei wird als separates Dokument behandelt.
- auto: Die Datei wird automatisch in Dokumente aufgeteilt.
Abrechnung und Preise
Zusammengesetzte Modelle werden wie einzelne benutzerdefinierte Modelle in Rechnung gestellt. Der Preis basiert auf der Anzahl der Seiten, die vom Downstreamanalysemodell analysiert werden. Die Abrechnung basiert auf dem Extraktionspreis für die Seiten, die an ein Extraktionsmodell weitergeleitet werden. Durch das Hinzufügen der expliziten Klassifizierung fallen Kosten für die Klassifizierung aller Seiten in der Eingabedatei an. Weitere Informationen finden Sie auf der Document Intelligence-Preisseite.
Verwenden des Modellerstellungsvorgangs
Erstellen Sie zunächst eine Liste aller Modell-IDs, die Sie in einem einzigen Modell kombinieren möchten.
Verwenden Sie Studio, die REST-API oder Clientbibliotheken, um die Modelle in einer einzelnen Modell-ID zusammenzufassen.
Verwenden Sie die ID des zusammengesetzten Modells, um Dokumente zu analysieren.
Abrechnung
Zusammengesetzte Modelle werden wie einzelne benutzerdefinierte Modelle in Rechnung gestellt. Der Preis basiert auf der Anzahl der analysierten Seiten. Die Abrechnung basiert auf dem Extraktionspreis für die Seiten, die an ein Extraktionsmodell weitergeleitet werden. Weitere Informationen finden Sie auf der Document Intelligence-Preisseite.
- Die Preise für die Analyse eines Dokuments mithilfe eines individuellen benutzerdefinierten Modells oder eines zusammengesetzten benutzerdefinierten Modells ändern sich nicht.
Features zusammengesetzter Modelle
Custom template
- undcustom neural
-Modelle können unabhängig von der API-Version in einem einzelnen zusammengesetzten Modell kombiniert werden.Die Antwort enthält eine
docType
-Eigenschaft, die angibt, welches der zusammengestellten Modelle zum Analysieren des Dokuments verwendet wurde.Bei
custom template
.Modellen kann das zusammengestellte Modell mithilfe von Variationen einer benutzerdefinierten Vorlage oder unterschiedlichen Formulartypen erstellt werden. Dieser Vorgang ist nützlich, wenn eingehende Formulare zu einer von mehreren Vorlagen gehören können.Bei
custom neural
-Modellen besteht die bewährte Methode darin, alle verschiedenen Variationen eines Dokumententyps zu einem einzigen Dataset für das Training hinzuzufügen und mit einem benutzerdefinierten neuronalen Modell zu trainieren. Dermodel compose
-Vorgang eignet sich am besten für Szenarios, in denen Dokumente unterschiedlicher Typen zur Analyse übermittelt werden.
Grenzwerte für das Zusammenstellen von Modellen
Mit dem
model compose
-Vorgang können Sie einer einzelnen Modell-ID bis zu 500 Modelle zuweisen. Sie können eine der folgenden Alternativen verwenden, wenn die Anzahl von Modellen, die Sie zusammenstellen möchten, die Obergrenze für zusammengestellte Modelle übersteigt:Klassifizieren Sie die Dokumente vor dem Aufrufen des benutzerdefinierten Modells. Sie können das Lesemodell verwenden und eine Klassifizierung basierend auf dem extrahierten Text aus den Dokumenten und bestimmten Ausdrücken erstellen, indem Sie Quellen wie Code, reguläre Ausdrücke oder Suche verwenden.
Wenn Sie dieselben Felder aus verschiedenen strukturierten, semistrukturierten und unstrukturierten Dokumenten extrahieren möchten, sollten Sie das benutzerdefinierte neurale Deep-Learning-Modell verwenden. Erfahren Sie mehr zu den Unterschieden zwischen dem benutzerdefinierten Vorlagenmodell und dem benutzerdefinierten neuronalen Modell.
Das Analysieren eines Dokuments mithilfe zusammengesetzter Modelle ist identisch mit der Analyse eines Dokuments mithilfe eines einzelnen Modells. Das
Analyze Document
-Ergebnis gibt einedocType
-Eigenschaft zurück, die angibt, welche Komponentenmodelle Sie für die Analyse des Dokuments ausgewählt haben.Der
model compose
-Vorgang ist derzeit nur für benutzerdefinierte Modelle verfügbar, die mit Bezeichnungen trainiert wurden.
Kompatibilität von zusammengestellten Modellen
Benutzerdefinierter Modelltyp | Modelle, die mit v2.1 und v2.0 trainiert wurden | Benutzerdefinierte Vorlagen und neuronale Modelle v3.1 und v3.0 | Benutzerdefinierte Vorlagen und neuronale Modelle v4.0 Preview | Benutzerdefinierte generative Modelle v4.0 Preview |
---|---|---|---|---|
Modelle, die mit Version 2.1 und v2.0 trainiert wurden | Nicht unterstützt | Nicht unterstützt | Nicht unterstützt | Nicht unterstützt |
Benutzerdefinierte Vorlagen und neuronale Modelle v3.0 und v3.1 | Nicht unterstützt | Unterstützt | Unterstützt | Nicht unterstützt |
Benutzerdefinierte Vorlagen und neuronale Modelle v4.0 Preview | Nicht unterstützt | Unterstützt | Unterstützt | Nicht unterstützt |
Benutzerdefinierte generative Modelle v4.0 Preview | Nicht unterstützt | Nicht unterstützt | Nicht unterstützt | Nicht unterstützt |
Trainieren Sie ein Modell mit der v3.0-API mit dem gleichen beschrifteten Dataset, um ein Modell zu erstellen, das mit einer früheren Version der API (v2.1 oder früher) trainiert wurde. Durch diese Ergänzung wird sichergestellt, dass das v2.1-Modell mit anderen Modellen zusammengesetzt werden kann.
Modelle, die mit der Version 2.1 der API erstellt wurden, werden weiterhin unterstützt und erfordern keine Updates.
Entwicklungsoptionen
Document Intelligence v4.0:2024-07-31-preview unterstützt die folgenden Tools, Anwendungen und Bibliotheken:
Funktion | Ressourcen |
---|---|
Benutzerdefiniertes Modell | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Zusammengestelltes Modell | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Document Intelligence v3.1:2023-07-31 (GA) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:
Feature | Ressourcen |
---|---|
Benutzerdefiniertes Modell | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Zusammengestelltes Modell | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Document Intelligence v3.0:2022-08-31 (GA) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:
Feature | Ressourcen |
---|---|
Benutzerdefiniertes Modell | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Zusammengestelltes Modell | • Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Dokument Intelligenz v2.1 unterstützt die folgenden Ressourcen:
Feature | Ressourcen |
---|---|
Benutzerdefiniertes Modell | • Document Intelligence-Bezeichnungstool • REST-API • Clientbibliothek SDK • Document Intelligence-Docker-Container |
Zusammengestelltes Modell | • Document Intelligence-Bezeichnungstool • REST-API • C# SDK • Java SDK • JavaScript SDK • Python SDK |
Nächste Schritte
Erfahren Sie, wie Sie benutzerdefinierte Modelle erstellen und zusammenstellen: