Trainieren benutzerdefinierter Modelle
Der Azure KI Dokument Intelligenz-Dienst unterstützt überwachtes maschinelles Lernen. Sie können benutzerdefinierte Modelle trainieren und zusammengesetzte Modelle mit Formulardokumenten und JSON-Dokumenten erstellen, die beschriftete Felder enthalten.
So trainieren Sie ein benutzerdefiniertes Modell
- Speichern Sie Beispielformulare zusammen mit JSON-Dateien, die Layout- und Bezeichnungsfeldinformationen enthalten, in einem Azure-Blobcontainer.
- Sie können mit der Azure KI Dokument Intelligenz-Funktion Dokument analysieren für jedes Beispielformular eine ocr.json-Datei generieren. Darüber hinaus benötigen Sie eine einzelne fields.json-Datei, die die zu extrahierenden Felder beschreibt, und für jedes Beispielformular eine labels.json-Datei, die die Felder ihrer Position in diesem Formular zuordnet.
- Generieren Sie eine SAS-URL (Shared Access Security) für den Container.
- Verwenden Sie die REST-API-Funktion Modell erstellen (oder eine entsprechende SDK-Methode).
- Rufen Sie mit der REST-API-Funktion Modell abrufen oder einer entsprechenden SDK-Methode die trainierte Modell-ID ab.
OR
- Verwenden Sie Azure KI Dokument Intelligenz Studio zum Bezeichnen und Trainieren. Für benutzerdefinierte Formulare gibt es zwei Arten zugrunde liegender Modelle: benutzerdefinierte Vorlagenmodelle und benutzerdefinierte neuronale Modelle.
- Benutzerdefinierte Vorlagenmodelle können beschriftete Schlüssel-Wert-Paare, Auswahlfelder, Tabellen, Regionen und Signaturen zuverlässig aus Dokumenten extrahieren. Das Training dauert nur wenige Minuten, und es werden über 100 Sprachen unterstützt.
- Benutzerdefinierte neuronale Modelle sind Deep Learning-Modelle, die Layout- und Sprachfeatures kombinieren, um beschriftete Felder aus Dokumenten zuverlässig zu extrahieren. Dieses Modell eignet sich am besten für halbstrukturierte oder unstrukturierte Dokumente.