Erste Schritte mit Azure KI Dokument Intelligenz

Abgeschlossen

Um ein Projekt mit Azure KI Dokument Intelligenz-Diensten zu starten, müssen Sie Folgendes vorbereiten:

  • Über ein Azure-Ressourcenabonnement
  • Eine Auswahl von Formulardateien für die Datenextraktion

Abonnieren einer Ressource

Sie können über die folgenden Ressourcen auf Azure KI Dokument Intelligenz-Dienste zugreifen:

  • Azure KI Services-Ressource: Abonnementschlüssel für mehrere Dienste (wird für mehrere Azure KI Services-Instanzen verwendet)

ODER

  • Azure KI Dokument Intelligenz-Ressource: Abonnementschlüssel für einen einzelnen Dienst (wird nur für eine bestimmte Azure KI Services-Instanz verwendet)

Hinweis

Erstellen Sie eine Azure KI Services-Ressource, wenn Sie planen, unter einem einzelnen Endpunkt bzw. Schlüssel auf mehrere Azure KI Services-Instanzen zuzugreifen. Erstellen Sie nur für den Zugriff auf Azure KI Dokument Intelligenz eine Azure KI Dokument Intelligenz-Ressource. Beachten Sie, dass Sie eine einzelne Dienstressource benötigen, wenn Sie die Microsoft Entra-Authentifizierung verwenden möchten.

Sie können einen Dienst im Azure-Portal oder mit der Azure-Befehlszeilenschnittstelle (Command Line Interface, CLI) abonnieren. Weitere Informationen zu diesen CLI-Befehlen finden Sie hier.

Grundlegendes zu den Anforderungen für die Eingabe von Azure KI Dokument Intelligenz-Dateien

Azure KI Dokument Intelligenz arbeitet mit Eingabedokumenten, die die folgenden Anforderungen erfüllen:

  • Als Format muss JPEG, PNG, BMP, PDF (Text oder gescannt) oder TIFF verwendet werden.
  • Die Datei muss im kostenpflichtigen Tarif (S0) kleiner als 500 MB und im kostenlosen Tarif (F0) kleiner als 4 MB sein.
  • Bei Bildern müssen die Abmessungen zwischen 50 × 50 Pixel und 10.000 × 10.000 Pixel liegen.
  • Die Gesamtgröße des Trainingsdatasets darf maximal 500 Seiten betragen.

Weitere Eingabeanforderungen finden Sie in der Dokumentation für spezifische Modelle.

Entscheiden, welche Komponente von Azure KI Dokument Intelligenz verwendet werden soll

Nachdem Sie Ihre Dateien erfasst haben, entscheiden Sie, was Sie erreichen müssen.

  • Um OCR-Funktionen zum Erfassen einer Dokumentanalyse zu nutzen, verwenden Sie das Layoutmodell, das Lesemodell oder das allgemeine Dokumentmodell.

  • Verwenden Sie zum Erstellen einer Anwendung, die Daten aus W-2s, Rechnungen, Belegen, Ausweisdokumenten, Krankenversicherungsdokumenten, Impfpässen und Visitenkarten extrahiert, ein vordefiniertes Modell. Diese Modelle müssen nicht trainiert werden. Azure KI Dokument Intelligenz-Dienste analysieren die Dokumente und geben eine JSON-Ausgabe zurück.

  • Um eine Anwendung zum Extrahieren von Daten aus Ihren branchenspezifischen Formularen zu erstellen, erstellen Sie ein benutzerdefiniertes Modell. Dieses Modell muss mit Beispieldokumenten trainiert werden. Nach dem Training kann das benutzerdefinierte Modell neue Dokumente analysieren und eine JSON-Ausgabe zurückgeben.