Was ist Azure KI Dokument Intelligenz?
Azure KI Dokument Intelligenz ist eine der zahlreichen Komponenten von Azure KI Services – cloudbasierten KI-Diensten mit REST-APIs und Clientbibliotheks-SDKs, mit denen Sie Intelligenz in Ihre Anwendungen integrieren können.
Azure KI Dokument Intelligenz verwendet OCR-Funktionen (Optical Character Recognition, optische Zeichenerkennung) und Deep Learning-Modelle, um Text, Schlüssel-Wert-Paare, Auswahlmarkierungen und Tabellen aus Dokumenten zu extrahieren.
OCR erfasst die Dokumentstruktur, indem Begrenzungsrahmen um erkannte Objekte in einem Bild erstellt werden. Die Positionen der Begrenzungsrahmen werden als Koordinaten im Verhältnis zum Rest der Seite aufgezeichnet. Azure KI Dokument Intelligenz-Dienste geben Begrenzungsrahmen und andere Informationen in strukturierter Form mit den Beziehungen aus der ursprünglichen Datei zurück.
Um ein Modell mit hoher Genauigkeit von Grund auf neu zu erstellen, müssen Benutzer Deep Learning-Modelle erstellen, umfangreiche Computeressourcen verwenden und lange Modelltrainingszeiten bewältigen. Diese Faktoren können ein Projekt undurchführbar machen. Azure KI Dokument Intelligenz stellt zugrunde liegende Modelle bereit, die mit Tausenden von Formularbeispielen trainiert wurden. Dank der zugrunde liegenden Modelle können Sie ohne oder mit nur geringem Modelltraining mit hoher Genauigkeit eine Datenextraktion aus Ihren Formularen durchführen.
Azure KI Dokument Intelligenz-Dienstkomponenten
Azure KI Dokument Intelligenz besteht aus den folgenden Diensten:
Dokumentanalysemodelle: Diese Modelle akzeptieren die Eingabe von JPEG-, PNG-, PDF- und TIFF-Dateien und geben eine JSON-Datei mit der Textstelle in Begrenzungsfeldern, Textinhalten, Tabellen, Auswahlfeldern (auch als Kontrollkästchen oder Optionsschaltflächen bezeichnet) und Dokumentstruktur zurück.
Vordefinierte Modelle: Diese Modelle erkennen und extrahieren Informationen aus Dokumentbildern und geben die extrahierten Daten in einer strukturierten JSON-Ausgabe zurück. Azure KI Dokument Intelligenz unterstützt derzeit vordefinierte Modelle für mehrere Formulare, darunter:
- W-2-Formulare
- Rechnungen
- Receipts
- Ausweisdokumente
- Visitenkarten
Benutzerdefinierte Modelle: Benutzerdefinierte Modelle extrahieren Daten aus Formularen, die für Ihr Unternehmen spezifisch sind. Benutzerdefinierte Modelle können über Azure KI Dokument Intelligenz Studio trainiert werden.
Hinweis
Manche Azure KI Dokument Intelligenz-Features befanden sich zum Zeitpunkt der Erstellung dieses Inhalts in der Vorschau. Infolgedessen können sich Features und Verwendung im Detail noch ändern. Aktuelle Informationen finden Sie auf der offiziellen Seite.
Zugreifen auf Dienste mit den Clientbibliothek-SDKs oder der REST-API
Sie können auf Azure KI Dokument Intelligenz-Dienste zugreifen, indem Sie eine REST-API, Clientbibliotheks-SDKs und Azure Dokument Intelligenz Studio verwenden, um die Dienste in Ihrem Workflow oder Ihre Anwendung zu integrieren.
Tipp
Die Übung dieses Moduls konzentriert sich auf die Python- und .NET SDKs. Die zugrunde liegenden REST-Dienste können von jeder Sprache verwendet werden.
In der Dokumentation finden Sie Schnellstartanleitungen zu allen verfügbaren SDKs und der REST-API.