Was ist Azure KI Dokument Intelligenz?

Abgeschlossen

Azure KI Dokument Intelligenz ist eine der zahlreichen Komponenten von Azure KI Services – cloudbasierten KI-Diensten mit REST-APIs und Clientbibliotheks-SDKs, mit denen Sie Intelligenz in Ihre Anwendungen integrieren können.

Azure KI Dokument Intelligenz verwendet OCR-Funktionen (Optical Character Recognition, optische Zeichenerkennung) und Deep Learning-Modelle, um Text, Schlüssel-Wert-Paare, Auswahlmarkierungen und Tabellen aus Dokumenten zu extrahieren.

Screenshot of how OCR works.

OCR erfasst die Dokumentstruktur, indem Begrenzungsrahmen um erkannte Objekte in einem Bild erstellt werden. Die Positionen der Begrenzungsrahmen werden als Koordinaten im Verhältnis zum Rest der Seite aufgezeichnet. Azure KI Dokument Intelligenz-Dienste geben Begrenzungsrahmen und andere Informationen in strukturierter Form mit den Beziehungen aus der ursprünglichen Datei zurück.

Screenshot of JSON output sample.

Um ein Modell mit hoher Genauigkeit von Grund auf neu zu erstellen, müssen Benutzer Deep Learning-Modelle erstellen, umfangreiche Computeressourcen verwenden und lange Modelltrainingszeiten bewältigen. Diese Faktoren können ein Projekt undurchführbar machen. Azure KI Dokument Intelligenz stellt zugrunde liegende Modelle bereit, die mit Tausenden von Formularbeispielen trainiert wurden. Dank der zugrunde liegenden Modelle können Sie ohne oder mit nur geringem Modelltraining mit hoher Genauigkeit eine Datenextraktion aus Ihren Formularen durchführen.

Azure KI Dokument Intelligenz-Dienstkomponenten

Azure KI Dokument Intelligenz besteht aus den folgenden Diensten:

  • Dokumentanalysemodelle: Diese Modelle akzeptieren die Eingabe von JPEG-, PNG-, PDF- und TIFF-Dateien und geben eine JSON-Datei mit der Textstelle in Begrenzungsfeldern, Textinhalten, Tabellen, Auswahlfeldern (auch als Kontrollkästchen oder Optionsschaltflächen bezeichnet) und Dokumentstruktur zurück.

  • Vordefinierte Modelle: Diese Modelle erkennen und extrahieren Informationen aus Dokumentbildern und geben die extrahierten Daten in einer strukturierten JSON-Ausgabe zurück. Azure KI Dokument Intelligenz unterstützt derzeit vordefinierte Modelle für mehrere Formulare, darunter:

    • W-2-Formulare
    • Rechnungen
    • Receipts
    • Ausweisdokumente
    • Visitenkarten
  • Benutzerdefinierte Modelle: Benutzerdefinierte Modelle extrahieren Daten aus Formularen, die für Ihr Unternehmen spezifisch sind. Benutzerdefinierte Modelle können über Azure KI Dokument Intelligenz Studio trainiert werden.

Hinweis

Manche Azure KI Dokument Intelligenz-Features befanden sich zum Zeitpunkt der Erstellung dieses Inhalts in der Vorschau. Infolgedessen können sich Features und Verwendung im Detail noch ändern. Aktuelle Informationen finden Sie auf der offiziellen Seite.

Zugreifen auf Dienste mit den Clientbibliothek-SDKs oder der REST-API

Sie können auf Azure KI Dokument Intelligenz-Dienste zugreifen, indem Sie eine REST-API, Clientbibliotheks-SDKs und Azure Dokument Intelligenz Studio verwenden, um die Dienste in Ihrem Workflow oder Ihre Anwendung zu integrieren.

Tipp

Die Übung dieses Moduls konzentriert sich auf die Python- und .NET SDKs. Die zugrunde liegenden REST-Dienste können von jeder Sprache verwendet werden.

In der Dokumentation finden Sie Schnellstartanleitungen zu allen verfügbaren SDKs und der REST-API.