Freigeben über


Klassifikator für Inhaltsverständnis

Von Bedeutung

  • Die Klassifizierer-API ist nur für Dokumente mit der 2025-05-01-preview Version verfügbar.
  • Der Klassifizierer für Azure AI Content Understanding ist in 2025-05-01-preview version verfügbar. Öffentliche Vorschauversionen bieten frühzeitigen Zugriff auf Features, die sich in der aktiven Entwicklung befinden.
  • Features, Ansätze und Prozesse können sich vor der allgemeinen Verfügbarkeit (General Availability, GA) noch ändern oder eine eingeschränkte Funktionalität aufweisen.
  • Weitere Informationen finden Sie in den ergänzenden Nutzungsbedingungen für Microsoft Azure-Vorschauversionen.

Der Klassifizierungsbezeichner für Azure AI Content Understanding ermöglicht es Ihnen, Dokumente zu erkennen und zu identifizieren, die Sie innerhalb Ihrer Anwendung verarbeiten. Der Klassifizierer für Inhaltsverständnis kann die Klassifizierung einer Eingabedatei als Ganzes ausführen oder mehrere Dokumente oder mehrere Instanzen eines einzelnen Dokuments innerhalb einer Eingabedatei identifizieren.

Anwendungsfälle für Unternehmen

Klassifizierer können komplexe Dokumente in verschiedenen Formaten und Vorlagen verarbeiten:

  • Rechnungen: Kategorisieren Sie Rechnungen von mehreren Anbietern, damit jede Kategorie bei Bedarf mit einem anderen Analysetool für Inhaltsverständnis verarbeitet wird.
  • Steuerdokumente: Kategorisieren Mehrerer Steuerdokumente in verschiedene Arten von Steuerformularen wie 1040, 1099 usw.
  • Verträge: Lange, unstrukturierte Verträge können jetzt kategorisiert werden, um Vorgänge zu rationalisieren, um verschiedene Arten von Vereinbarungen und ihre spezifischen rechtlichen Auswirkungen zu verstehen.

Funktionen zum Klassifizierer für Inhaltsverständnis

Inhaltsverständnisklassifizierer können ein einzelnes oder mehrere Dateidokumente analysieren, um zu identifizieren, ob eine Eingabedatei gemäß Definition in eine Kategorie klassifiziert werden kann. Im Folgenden sind die derzeit unterstützte Szenarien aufgeführt:

  • Eine einzelne Datei, die einen Dokumenttyp enthält, z. B. ein Formular für einen Darlehensantrag.
  • Eine einzelne Datei, die mehrere Dokumenttypen enthält. Ein Beispiel ist ein Kreditantragspaket, das ein Kreditantragsformular, eine Lohnabrechnung und einen Bankauszug enthält.
  • Eine einzelne Datei, die mehrere Instanzen desselben Dokuments enthält (z. B. eine Sammlung gescannter Rechnungen)
  • Standardmäßig gibt es auch eine $OTHER Klasse, in die wir die Seiten für Fälle kategorisieren, in denen eine der definierten Kategorien nicht geeignet erscheint.

So verwenden Sie den Klassifizierer für Inhaltsverständnis

Inhaltsverständnisklassifizierer erfordert kein Schulungsdatensatz. Definieren Sie bis zu 50 Kategorienamen und -beschreibungen, und erstellen Sie einen Klassifizierer. Standardmäßig wird die gesamte Datei als einzelnes Inhaltsobjekt behandelt, was bedeutet, dass die Datei/das Objekt einer einzelnen Kategorie zugeordnet ist.

Wenn Sie jedoch mehrere Dokumente in einer Datei haben, kann der Klassifizierer die verschiedenen Dokumenttypen identifizieren, die in der Eingabedatei enthalten sind, und er kann sie trennen. Die Antwort des Klassifizierers enthält die Seitenbereiche für jeden der identifizierten Dokumenttyp, die in einer Datei enthalten sind. Diese Antwort kann mehrere Instanzen desselben Dokumenttyps enthalten.

Wenn Sie den Klassifizierer aufrufen, enthält der analyze Vorgang eine splitMode Eigenschaft, mit der Sie präzise Kontrolle über das Aufteilungsverhalten erhalten. Sie können auch die Seitenzahlen festlegen, um nur bestimmte Seiten des Eingabedokuments zu analysieren.

  • Um die gesamte Eingabedatei als einzelnes Dokument für die Klassifizierung zu behandeln, legen Sie dies splitMode auf none. Wenn Sie dies tun, gibt der Dienst nur eine Kategorie für die gesamte Eingabedatei zurück.
  • Um jede Seite der Eingabedatei zu klassifizieren, legen Sie folgendes splitMode fest:perPage Der Dienst versucht, jede Seite als einzelnes Dokument zu klassifizieren.
  • Legen Sie splitMode auf auto fest, und der Dienst identifiziert die Dokumente und die zugeordneten Seitenbereiche.

Optionale Analyse

Für einen vollständigen End-to-End-Fluss können Sie Klassifiziererkategorien mit vorhandenen Analysegeräten verknüpfen. Für jedes Inhaltsobjekt, das in Kategorien mit verknüpften Analyzern klassifiziert wurde, ruft der Dienst automatisch die Analyse des Inhaltsobjekts mithilfe der entsprechenden Analyse auf. Als Beispiel kann diese Verknüpfung verwendet werden, um Klassifizierer zu erstellen, die nur Rechnungen aus einer PDF identifizieren und analysieren, die mehrere Arten von Formularen in einem Dokument enthalten können.

  • Legen Sie die analyzerId Option auf eine vorhandene Analyse fest, um die Feldextraktion von den klassifizierten Dokumenten oder Seiten weiterzuleiten und auszuführen.

Klassifizierungsgrenzwerte

Informationen zu unterstützten Eingabedokumentformaten und Klassifizierungsgrenzwerten finden Sie auf unserer Seite " Dienstkontingente und Grenzwerte ".

Bewährte Methoden

Um die Klassifizierung und aufteilungsqualität zu verbessern, ist es wichtig, einen guten Kategorienamen und eine gute Beschreibung zu geben, damit das Modell die Kategorien mit einem gewissen Kontext verstehen kann. Weitere Informationen zu Kategorienamen und Beschreibungen finden Sie unterBewährte Methoden.

Hauptvorteile

  • Genauigkeit und Zuverlässigkeit: Stellen Sie eine präzise Dokumentklassifizierung sicher, reduzieren Sie Fehler und steigern Sie die Effizienz.
  • Skalierbarkeit: Skalieren Sie die Dokumentverarbeitung nahtlos, um die geschäftlichen Anforderungen zu erfüllen.
  • Anpassbar: Passen Sie den Dokumentklassifizierer an bestimmte Workflows an.

Unterstützte Sprachen und Regionen

Eine ausführliche Liste der unterstützten Sprachen und Regionen finden Sie auf Seite zu unterstützten Sprachen und Regionen.

Datenschutz und Sicherheit

Entwickler, die Content Understanding verwenden, sollten die Richtlinien von Microsoft zu Kundendaten überprüfen. Weitere Informationen finden Sie auf unserer Seite Daten, Schutz und Datenschutzerklärung.

Nächster Schritt

  • Probieren Sie das Verarbeiten Ihrer Dokumente mithilfe von Content Understanding in Azure KI Foundry aus.
  • Erfahren Sie, wie Sie Dokumentinhalte analysieren Analysevorlagen.