Freigeben über


Häufig gestellte Fragen zur Dokumentverarbeitung

Dieser Artikel besteht aus häufig gestellten Fragen zum Dokumentverarbeitungsmodell in AI Builder. Wenn Sie Ihre Frage hier nicht finden, sehen Sie in Überblick über das Dokumentverarbeitungs-KI-Modell nach oder senden Sie Ihre Frage an die Power Automate-Community für AI Builder.

Funktionalität

Was kann ich mit der Dokumentverarbeitung tun?

Mit der Dokumentenverarbeitung können Sie ein benutzerdefiniertes KI-Modell erstellen, um Informationen aus verschiedenen Arten an Dokumenten zu extrahieren.

  • Die Option Dokumente mit fester Vorlage ist ideal, wenn die Elemente Ihrer Dokumente an ähnlichen Stellen zu finden sind. Dies ist normalerweise bei Rechnungen, Bestellungen, Lieferscheinen und Steuerformularen der Fall.
  • Die Option Allgemeine Dokumente ist ideal für alle Arten von Dokumenten, einschließlich der von der ersten Option unterstützten Dokumente, aber auch für Verträge, Leistungsbeschreibungen, Briefe und andere. Diese Option ist eventuell beim Extrahieren von Daten leistungsfähiger, erfordert jedoch eine längere Trainingszeit.

Weitere Informationen finden Sie unter Überblick über das Dokumentenverarbeitungsmodell.

Welche Arten von Dokumenten kann die Dokumentenverarbeitung verarbeiten?

Unterstützte Dateitypen sind PDF, JPG und PNG.

Welche Daten kann ich mit der Dokumentenverarbeitung aus Dokumenten extrahieren?

Die Dokumentenverarbeitung kann Felder, Tabellen und Kontrollkästchen aus Belegen extrahieren.

Weitere Informationen finden Sie unter Definieren Sie die zu extrahierenden Informationen.

Kann ich handschriftlichen Text aus Dokumenten extrahieren?

Ja Die Dokumentenverarbeitung kann gedruckten und handschriftlichen Text aus Ihren Dokumenten extrahieren.

Wie viele Beispiele benötige ich, um ein Dokumentverarbeitungsmodell zu trainieren?

Für hochwertige Belege, die das gleiche Layout verwenden, sollten fünf Beispieldokumente ausreichen. Bei Dokumenten von geringer Qualität (z. B. schlecht gescannte Dokumente) sind möglicherweise weitere Musterdokumente erforderlich. Um die Ergebnisse zu verbessern, verwenden Sie 15 bis 20 Beispieldokumente.

Best Practices

  • Für Vorlagendokumente

    • Ein (1) Layout pro Sammlung.
    • Das Layout muss innerhalb derselben Sammlung identisch sein.
    • Mindestens fünf (5) und maximal 20 Dokumente pro Sammlung (überschreiten Sie diese Grenze nicht).
  • Für allgemeine Dokumente

    • Erstellen Sie ein einzelnes Modell für alle Variationen eines Dokumenttyps, einschließlich strukturierter und unstrukturierter Dokumente.

    • Beschriften Sie Felder, die für ihre Werte relevant sind, um eine bessere Extraktionsgenauigkeit zu erzielen.

      Verwenden Sie beispielsweise „supplier_id“ für eine Lieferanten-ID. Feldnamen sollten mit der Sprache des Dokuments übereinstimmen.

    • Mindestens fünf (5) und maximal 20 Dokumente pro Sammlung (überschreiten Sie diese Grenze nicht).

Mein Modell wird derzeit in Version 3.1 (GA) veröffentlicht, und ich plane, es mit Version 4.0 (GA) neu zu trainieren. Ist es notwendig, alle meine Dokumente neu zu kennzeichnen?

Sofern Sie der Sammlung keine neuen Felder, Kontrollkästchen, Tabellen, Signaturen für die Datenextraktion oder neue Dokumente hinzufügen, müssen Sie nicht alle Dokumente mit Tags versehen.

Kann ich von einem Dokumenttyp zu einem anderen wechseln?

Ja, wenn Sie Ihr Modell bearbeiten, können Sie zwischen einem Dokumenttyp mit fester Vorlage und einem allgemeinen Dokumenttyp wechseln. Diese Option wird jedoch nicht für Rechnungen unterstützt.

Kann ein einziges Modell zur Verarbeitung von Formularen Informationen aus Belegen extrahieren, die unterschiedliche Layouts oder Vorlagen haben?

Ja Mit der Funktion Sammlungen trainieren Sie ein einziges Formularverarbeitungsmodell für die Verarbeitung von Belegen mit unterschiedlichen Layouts.

Weitere Informationen finden Sie unter Gruppieren Sie Belege nach Sammlungen.

Kann die Verarbeitung mehrere Formulare in einem einzigen Dokument verarbeiten?

Jedes Formular muss sich in einer eigenen Datei befinden. Wenn Sie beispielsweise ein PDF-Dokument mit mehreren Rechnungen haben, erstellen Sie für jede Rechnung eine separate Datei, bevor Sie sie an das Dokumentenverarbeitungsmodell senden.

Sie können auch Seiten angeben, die das Dokumentverarbeitungsmodell verarbeiten soll. Auf diese Weise können Sie die Funktionalität des Modells nutzen, um Seite für Seite in einer Schleife zu verarbeiten und ein Formular nach dem anderen zu bearbeiten.

Weitere Informationen finden Sie unter Seitenbereich.

Ich habe ein Dokumentverarbeitungsmodell trainiert, erhalte aber keine guten Ergebnisse, wenn es um extrahierte Daten geht. Wie kann ich das Modell verbessern?

Wenn Ihr Modell schlechte Ergebnisse liefert, nachdem Sie es trainiert haben, bearbeiten Sie das Modell und stellen Sie mehr Beispiele für das Training zur Verfügung. Je mehr Beispiele Sie bereitstellen, desto mehr lernt das KI-Modell, Daten aus Ihren Dokumenten zu extrahieren.

Weitere Informationen finden Sie unter Verbessern der Leistung Ihres Dokumentenverarbeitungsmodells.

Einschränkungen

Wieviele Belege kann ich maximal verarbeiten?

Sie können alle 60 Sekunden bis zu 360 Dokumente pro Umgebung verarbeiten.

Warum werden manche Zeichen falsch erkannt?

  • Es kann vorkommen, dass einige Zeichen verwechselt werden: 0 (Zahl) und O (Buchstabe), 1 (Zahl) und l (Buchstabe), 4 (Zahl) und A (Buchstabe) und mehr.
  • Es kann vorkommen, dass einige über oder nahe bei anderen liegende Zeichen falsch erkannt werden: O (Buchstabe) über einer vertikalen Linie wird zu einer 0 (Zahl), 5 (Zahl) über einer Linie wird zu einem $ (amerikanisches Dollarzeichen), l_ (Kleinbuchstabe, Unterstrich) wird zu einem L (Großbuchstabe) und mehr.
  • Es kann vorkommen, dass bestimmte Zeichen auf Dokumenten schlechter Qualität falsch oder gar nicht erkannt werden.

In den vorherigen Fällen kann nichts getan werden, um die Erkennung in AI Builder zu verbessern. Wir empfehlen, die Qualität und das Layout des Quelldokuments zu verbessern, um ähnliche Probleme zu lösen.

Anmerkung

Microsoft verbessert ständig die OCR-Technologie (Optical Character Recognition), um Zeichen zu erkennen, sodass solche Probleme seltener auftreten.

Kann ich ein Modell mit vielen Sammlungen erstellen?

Sie können bis zu 200 Sammlungen pro Modell erstellen. Das Trainieren von Modellen mit Allgemeinen Dokumenten mit Dutzenden von Sammlungen kann jedoch mehrere Stunden dauern und in seltenen Fällen eine Zeitüberschreitung verursachen. Wenn Ihr Modell eine große Anzahl an Sammlungen enthält, müssen Sie mit einer Wartezeit von bis zu 24 Stunden rechnen, bis das Modelltraining abgeschlossen ist.

Kann ich ein Modell in einer Lösung erstellen?

Derzeit ist es nicht möglich, ein Modell in einer Lösung zu erstellen.

Kann ich Verträge und Briefe in meinem Dokumentenverarbeitungsmodell verwenden?

Ja, unstrukturierte Dokumente wie Verträge und Briefe werden von der Dokumentenverarbeitung über die Option Allgemeine Dokumente unterstützt.

Vergleiche

Was sind die Unterschiede zwischen Dokumentenverarbeitung, Rechnungsverarbeitung, Belegverarbeitung, Ausweis Leser, Visitenkarte Leser und Texterkennung?

Abhängig von Ihrer Situation müssen Sie möglicherweise ein bestimmtes Modell oder eine Kombination davon verwenden.

Verwenden Sie Texterkennung, wenn Sie den gesamten Text in einem Bild oder einer PDF-Datei extrahieren möchten. Sie können dann beispielsweise im extrahierten Text nach einem Schlüsselwort suchen oder feste Regeln erstellen, um bestimmte Elemente zu extrahieren.

Wenn Sie Informationen aus Rechnungen, Quittungen, Pässen, Führerscheinen oder Visitenkarten extrahieren möchten, beginnen Sie mit dem entsprechenden vorgefertigten Modell:

Sie können diese vorgefertigten Modelle sofort verwenden, ohne ein neues Modell erstellen zu müssen. Diese Modelle können allgemeine Informationen extrahieren, die in dem entsprechenden Beleg zu finden sind.

Für jeden anderen Dokumenttyp können Sie ein benutzerdefiniertes Dokumentverarbeitungsmodell erstellen, um die benötigten Felder und Tabellen zu extrahieren. Dies gilt auch, wenn Sie zusätzliche Informationen benötigen, die das vorgefertigte Modell nicht bereitstellt.

Weitere Informationen finden Sie unter Benutzerdefiniertes Dokumentenverarbeitungsmodell.

Was ist der Unterschied zwischen AI Builder-Dokumentverarbeitung und Azure-Formularerkennung?

AI Builder-Dokumentverarbeitung basiert auf der Azure-Formularerkennung. Dadurch erhalten beide Produkte die neuesten Fortschritte bei Microsoft AI.

  • AI Builder ist Teil der Microsoft Power Platform. Auf diese Weise kann jeder mit einer benutzerfreundlichen Oberfläche KI in Apps und Automatisierung integrieren. Sie müssen kein Entwickler und keine Wissenschaftliche Fachkraft für Daten sein.

  • Azure- Form Recognizerrichtet sich an professionelle Entwickler. Sie können einfache REST-APIs verwenden, um ihren benutzerdefinierten Codelösungen KI-Funktionen hinzuzufügen.

Kostenoptionen

Wie viel kostet AI Builder-Dokumentverarbeitung?

Sie können die Dokumentenverarbeitung kostenlos ausprobieren, indem Sie eine Testversion starten. Nachdem Sie es getestet haben, müssen Sie AI Builder-Guthaben zur Verwendung der Dokumentverarbeitung kaufen. Jede Seite, die Sie mit der Dokumentverarbeitung verarbeiten, verbraucht AI Builder-Guthaben, auch wenn die Seite keine zu extrahierenden Daten enthält. AI Builder-Guthaben kann über AI Builder-Add-Ons erworben werden.

Weitere Informationen finden Sie unter AI Builder-Lizenzierung.