Benutzerdefinierte zusammengesetzte Dokument Intelligenz-Modelle

Artikel
08/14/2024

Wichtig

Public Preview-Releases von Dokument Intelligenz bieten frühzeitigen Zugriff auf Features, die sich in der aktiven Entwicklung befinden. Features, Ansätze und Prozesse können sich aufgrund von Benutzerfeedback vor der allgemeinen Verfügbarkeit (General Availability, GA) ändern.
Die öffentliche Vorschauversion von Dokument Intelligenz-Clientbibliotheken verwendet standardmäßig Version 2024-07-31-preview der REST-API.
Die Public Preview 2024-07-31-preview ist derzeit nur in den folgenden Azure-Regionen verfügbar. Beachten Sie, dass das benutzerdefinierte generative Modell (Dokumentfeldextraktion) in KI Studio nur in der Region „USA, Norden-Mitte“ verfügbar ist:
- USA, Osten
- USA, Westen 2
- Europa, Westen
- USA Nord Mitte

Dieser Inhalt gilt für: Version 4.0 (Vorschau) | Vorherige Versionen: Version 3.1 (GA) Version 3.0 (GA) Version 2.1 (GA)

Dieser Inhalt gilt für: Version 3.1 (GA) | Aktuelle Version: Version 4.0 (Vorschau) | Vorherige Versionen: Version 3.0 Version 2.1

Dieser Inhalt gilt für: Version 3.0 (GA) | Aktuelle Versionen: Version 4.0 (Vorschau) Version 3.1 | Vorherige Version: Version 2.1

Dieser Inhalt gilt für: Version 2.1 | Neueste Version: Version 4.0 (Vorschau)

Wichtig

Das model compose-Vorgangsverhalten ändert sich ab „api-version=2024-07-31-preview“. Der model compose-Vorgang in v4.0 und höheren Versionen fügt einen explizit trainierten Klassifizierer anstelle eines impliziten Klassifizierers für die Analyse hinzu. Informationen zur vorherigen Version für zusammengesetzte Modelle finden Sie unter Zusammengesetzte Modelle in v3.1. Wenn Sie derzeit zusammengesetzte Modelle verwenden, sollten Sie ein Upgrade auf die neueste Implementierung in Betracht ziehen.

Was ist ein zusammengesetztes Modell?

Mit zusammengesetzten Modellen können Sie mehrere benutzerdefinierte Modelle in ein zusammengesetztes Modell gruppieren, das mit einer einzelnen Modell-ID aufgerufen wird. Ihr zusammengesetztes Modell kann z. B. benutzerdefinierte Modelle einschließen, die trainiert wurden, um Ihre Bestellungsdokumente für Material, Ausrüstung und Möbel zu analysieren. Anstatt das entsprechende Modell manuell auszuwählen, können Sie ein zusammengesetztes Modell verwenden, um das zutreffende benutzerdefinierte Modell für jede Analyse und Extraktion zu bestimmen.

Einige Szenarios erfordern zuerst die Klassifizierung des Dokuments und dann die Analyse des Dokuments mit dem Modell, das am besten geeignet ist, um die Felder aus dem Modell zu extrahieren. Solche Szenarios können Fälle umfassen, in denen ein Benutzer ein Dokument hochlädt, der Dokumenttyp jedoch nicht explizit bekannt ist. Ein weiteres Szenario besteht darin,dass mehrere Dokumente in einer einzigen Datei gescannt werden und die Datei zur Verarbeitung übermittelt wird. Ihre Anwendung muss dann die Komponentendokumente identifizieren und das beste Modell für jedes Dokument auswählen.

In früheren Versionen hat der model compose-Vorgang eine implizite Klassifizierung durchgeführt, um zu entscheiden, welches benutzerdefinierte Modell das übermittelte Dokument am besten darstellt. Die 2024-07-31-preview-Implementierung des model compose-Vorgangs ersetzt die implizite Klassifizierung aus den früheren Versionen durch einen expliziten Klassifizierungsschritt und fügt bedingtes Routing hinzu.

Vorteile des neuen Modellzusammensetzungsvorgangs

Der neue model compose-Vorgang erfordert, dass Sie einen expliziten Klassifizierer trainieren. Der Vorgang bietet mehrere Vorteile.

Kontinuierliche inkrementelle Verbesserung: Sie können die Qualität des Klassifizierers konsistent verbessern, indem Sie weitere Beispiele hinzufügen und die Klassifizierung inkrementell verbessern. Durch diese Optimierung wird sichergestellt, dass Ihre Dokumente immer an das richtige Modell zur Extraktion weitergeleitet werden.
Vollständige Kontrolle über Routing: Durch das Hinzufügen des konfidenzbasierten Routings stellen Sie einen Konfidenzschwellenwert für den Dokumenttyp und die Klassifizierungsantwort bereit.
Ignorieren dokumentspezifischer Dokumenttypen während des Vorgangs: Bei früheren Implementierungen des model compose-Vorgangs wurde das beste Analysemodell für die Extraktion basierend auf der Konfidenzbewertung ausgewählt, auch wenn die höchsten Konfidenzbewertungen relativ niedrig waren. Wenn Sie einen Konfidenzschwellenwert angeben oder einen bekannten Dokumenttyp aus der Klassifizierung nicht explizit einem Extraktionsmodell zuordnen, können Sie bestimmte Dokumenttypen ignorieren.
Analysieren mehrerer Instanzen desselben Dokumenttyps: Bei der Kombination mit der splitMode-Option des Klassifizierers kann der model compose-Vorgang mehrere Instanzen desselben Dokuments in einer Datei erkennen und die Datei aufteilen, um die Dokumente unabhängig voneinander zu verarbeiten. Die Verwendung von splitMode ermöglicht die Verarbeitung mehrerer Instanzen eines Dokuments in einer einzigen Anforderung.
Unterstützung für Add-On-Features: Add-On-Features wie Abfragefelder oder Barcodes können auch als Teil der Analysemodellparameter angegeben werden.
Erweiterung auf bis zu 500 zugewiesene benutzerdefinierte Modelle: Mit der neuen Implementierung des model compose-Vorgangs können Sie einem einzelnen zusammengesetzten Modell bis zu 500 trainierte benutzerdefinierte Modelle zuweisen.

Verwenden von „model compose“

Beginnen Sie mit dem Sammeln von Stichproben aus allen benötigten Dokumenten (einschließlich Stichproben mit Informationen, die extrahiert oder ignoriert werden sollen).
Trainieren Sie einen Klassifizierer, indem Sie die Dokumente in Ordnern organisieren, bei denen die Ordnernamen dem Dokumenttyp entsprechen, den Sie in Ihrer Definition für zusammengesetzte Modelle verwenden möchten.
Trainieren Sie schließlich ein Extraktionsmodell für die einzelnen Dokumenttypen, die Sie verwenden möchten.
Nachdem Ihre Klassifizierungs- und Extraktionsmodelle trainiert wurden, verwenden Sie Document Intelligence Studio, Clientbibliotheken oder die REST-API, um die Klassifizierungs- und Extraktionsmodelle in einem zusammengesetzten Modell zu kombinieren.

Verwenden Sie den splitMode-Parameter, um das Dateiaufteilungsverhalten zu steuern:

Keine. Die gesamte Datei wird als einzelnes Dokument behandelt.
perPage: Jede Seite in der Datei wird als separates Dokument behandelt.
auto: Die Datei wird automatisch in Dokumente aufgeteilt.

Abrechnung und Preise

Zusammengesetzte Modelle werden wie einzelne benutzerdefinierte Modelle in Rechnung gestellt. Der Preis basiert auf der Anzahl der Seiten, die vom Downstreamanalysemodell analysiert werden. Die Abrechnung basiert auf dem Extraktionspreis für die Seiten, die an ein Extraktionsmodell weitergeleitet werden. Durch das Hinzufügen der expliziten Klassifizierung fallen Kosten für die Klassifizierung aller Seiten in der Eingabedatei an. Weitere Informationen finden Sie auf der Document Intelligence-Preisseite.

Verwenden von „model compose“

Erstellen Sie zunächst eine Liste aller Modell-IDs, die Sie in einem einzigen Modell kombinieren möchten.
Verwenden Sie Studio, die REST-API oder Clientbibliotheken, um die Modelle in einer einzelnen Modell-ID zusammenzufassen.
Verwenden Sie die ID des zusammengesetzten Modells, um Dokumente zu analysieren.

Abrechnung

Zusammengesetzte Modelle werden wie einzelne benutzerdefinierte Modelle in Rechnung gestellt. Der Preis basiert auf der Anzahl der analysierten Seiten. Die Abrechnung basiert auf dem Extraktionspreis für die Seiten, die an ein Extraktionsmodell weitergeleitet werden. Weitere Informationen finden Sie auf der Document Intelligence-Preisseite.

Die Preise für die Analyse eines Dokuments mithilfe eines individuellen benutzerdefinierten Modells oder eines zusammengesetzten benutzerdefinierten Modells ändern sich nicht.

Features zusammengesetzter Modelle

Custom template- und custom neural-Modelle können unabhängig von der API-Version in einem einzelnen zusammengesetzten Modell kombiniert werden.
Die Antwort enthält eine docType-Eigenschaft, die angibt, welches der zusammengestellten Modelle zum Analysieren des Dokuments verwendet wurde.
Bei custom template.Modellen kann das zusammengestellte Modell mithilfe von Variationen einer benutzerdefinierten Vorlage oder unterschiedlichen Formulartypen erstellt werden. Dieser Vorgang ist nützlich, wenn eingehende Formulare zu einer von mehreren Vorlagen gehören können.
Bei custom neural-Modellen besteht die bewährte Methode darin, alle verschiedenen Variationen eines Dokumententyps zu einem einzigen Dataset für das Training hinzuzufügen und mit einem benutzerdefinierten neuronalen Modell zu trainieren. Der model compose-Vorgang eignet sich am besten für Szenarios, in denen Dokumente unterschiedlicher Typen zur Analyse übermittelt werden.

Grenzwerte für das Zusammenstellen von Modellen

Mit dem model compose-Vorgang können Sie einer einzelnen Modell-ID bis zu 500 Modelle zuweisen. Sie können eine der folgenden Alternativen verwenden, wenn die Anzahl von Modellen, die Sie zusammenstellen möchten, die Obergrenze für zusammengestellte Modelle übersteigt:
- Klassifizieren Sie die Dokumente vor dem Aufrufen des benutzerdefinierten Modells. Sie können das Lesemodell verwenden und eine Klassifizierung basierend auf dem extrahierten Text aus den Dokumenten und bestimmten Ausdrücken erstellen, indem Sie Quellen wie Code, reguläre Ausdrücke oder Suche verwenden.
- Wenn Sie dieselben Felder aus verschiedenen strukturierten, semistrukturierten und unstrukturierten Dokumenten extrahieren möchten, sollten Sie das benutzerdefinierte neurale Deep-Learning-Modell verwenden. Erfahren Sie mehr zu den Unterschieden zwischen dem benutzerdefinierten Vorlagenmodell und dem benutzerdefinierten neuronalen Modell.
Das Analysieren eines Dokuments mithilfe zusammengesetzter Modelle ist identisch mit der Analyse eines Dokuments mithilfe eines einzelnen Modells. Das Analyze Document-Ergebnis gibt eine docType-Eigenschaft zurück, die angibt, welche Komponentenmodelle Sie für die Analyse des Dokuments ausgewählt haben.
Der model compose-Vorgang ist derzeit nur für benutzerdefinierte Modelle verfügbar, die mit Bezeichnungen trainiert wurden.

Kompatibilität von zusammengestellten Modellen

Benutzerdefinierter Modelltyp	Modelle, die mit v2.1 und v2.0 trainiert wurden	Benutzerdefinierte Vorlagen und neuronale Modelle v3.1 und v3.0	Benutzerdefinierte Vorlagen und neuronale Modelle v4.0 Preview	Benutzerdefinierte generative Modelle v4.0 Preview
Modelle, die mit Version 2.1 und v2.0 trainiert wurden	Nicht unterstützt	Nicht unterstützt	Nicht unterstützt	Nicht unterstützt
Benutzerdefinierte Vorlagen und neuronale Modelle v3.0 und v3.1	Nicht unterstützt	Unterstützt	Unterstützt	Nicht unterstützt
Benutzerdefinierte Vorlagen und neuronale Modelle v4.0 Preview	Nicht unterstützt	Unterstützt	Unterstützt	Nicht unterstützt
Benutzerdefinierte generative Modelle v4.0 Preview	Nicht unterstützt	Nicht unterstützt	Nicht unterstützt	Nicht unterstützt

Trainieren Sie ein Modell mit der v3.0-API mit dem gleichen beschrifteten Dataset, um ein Modell zu erstellen, das mit einer früheren Version der API (v2.1 oder früher) trainiert wurde. Durch diese Ergänzung wird sichergestellt, dass das v2.1-Modell mit anderen Modellen zusammengesetzt werden kann.
Modelle, die mit der Version 2.1 der API erstellt wurden, werden weiterhin unterstützt und erfordern keine Updates.

Entwicklungsoptionen

Document Intelligence v4.0:2024-07-31-preview unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Funktion	Ressourcen
Benutzerdefiniertes Modell	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK
Zusammengestelltes Modell	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK

Document Intelligence v3.1:2023-07-31 (GA) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature	Ressourcen
Benutzerdefiniertes Modell	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK
Zusammengestelltes Modell	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK

Document Intelligence v3.0:2022-08-31 (GA) unterstützt die folgenden Tools, Anwendungen und Bibliotheken:

Feature	Ressourcen
Benutzerdefiniertes Modell	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK
Zusammengestelltes Modell	• Document Intelligence Studio • REST API • C# SDK • Java SDK • JavaScript SDK • Python SDK

Dokument Intelligenz v2.1 unterstützt die folgenden Ressourcen:

Feature	Ressourcen
Benutzerdefiniertes Modell	• Document Intelligence-Bezeichnungstool • REST-API • Clientbibliothek SDK • Document Intelligence-Docker-Container
Zusammengestelltes Modell	• Document Intelligence-Bezeichnungstool • REST-API • C# SDK • Java SDK • JavaScript SDK • Python SDK

Nächste Schritte

Erfahren Sie, wie Sie benutzerdefinierte Modelle erstellen und zusammenstellen:

Erstellen eines benutzerdefinierten ModellsVerfassen benutzerdefinierter Modelle

Teilen über

Benutzerdefinierte zusammengesetzte Dokument Intelligenz-Modelle

Was ist ein zusammengesetztes Modell?

Vorteile des neuen Modellzusammensetzungsvorgangs

Verwenden von „model compose“

Abrechnung und Preise

Verwenden von „model compose“

Abrechnung

Features zusammengesetzter Modelle

Grenzwerte für das Zusammenstellen von Modellen

Kompatibilität von zusammengestellten Modellen

Entwicklungsoptionen

Nächste Schritte

Feedback

Zusätzliche Ressourcen