Häufig gestellte Fragen zur Dokumentverarbeitung
Dieser Artikel besteht aus häufig gestellten Fragen zum Dokumentverarbeitungsmodell in AI Builder. Wenn Sie Ihre Frage hier nicht finden, überprüfen Sie Überblick über das Dokumentverarbeitungs-KI-Modell oder senden Sie Ihre Frage an die Power Automate-Community für AI Builder.
Mit der Dokumentenverarbeitung können Sie ein benutzerdefiniertes KI-Modell erstellen, um Informationen aus verschiedenen Arten an Dokumenten zu extrahieren.
- Die Option Dokumente mit fester Vorlage ist ideal, wenn die Elemente Ihrer Dokumente an ähnlichen Stellen zu finden sind. Dies ist normalerweise bei Rechnungen, Bestellungen, Lieferscheinen und Steuerformularen der Fall.
- Die Option Allgemeine Dokumente ist ideal für alle Arten von Dokumenten, einschließlich der von der ersten Option unterstützten Dokumente, aber auch Verträge, Leistungsbeschreibungen, Briefe und andere. Diese Option ist eventuell beim Extrahieren von Daten leistungsfähiger, erfordert jedoch eine längere Trainingszeit.
Weitere Informationen: Überblick über das Dokumentenverarbeitungsmodell
Unterstützte Dateitypen sind PDF, JPG und PNG.
Die Dokumentenverarbeitung kann Felder, Tabellen und Kontrollkästchen aus Belegen extrahieren.
Erfahren Sie mehr darüber: Definieren Sie zu extrahierende Informationen
Ja Die Dokumentenverarbeitung kann gedruckten und handschriftlichen Text aus Ihren Dokumenten extrahieren.
Für hochwertige Belege, die das gleiche Layout verwenden, sollten fünf Beispieldokumente ausreichen. Bei Dokumenten von geringer Qualität (z. B. schlecht gescannte Dokumente) sind möglicherweise weitere Beispieldokumente erforderlich. Um die Ergebnisse zu verbessern, verwenden Sie 15 bis 20 Beispieldokumente.
Kann ein einziges Modell zur Verarbeitung von Formularen Informationen aus Belegen extrahieren, die unterschiedliche Layouts oder Vorlagen haben?
Ja Mit der Funktion Sammlungen trainieren Sie ein einziges Formularverarbeitungsmodell für die Verarbeitung von Belegen mit unterschiedlichen Layouts.
Weitere Informationen: Gruppieren Sie Belege nach Sammlungen
Jedes Formular muss sich in einer eigenen Datei befinden. Wenn Sie beispielsweise ein PDF-Dokument mit mehreren Rechnungen haben, erstellen Sie für jede Rechnung eine separate Datei, bevor Sie sie an das Dokumentenverarbeitungsmodell senden.
Sie können auch Seiten angeben, die das Dokumentverarbeitungsmodell verarbeiten soll. Auf diese Weise können Sie die Funktionalität des Modells nutzen, um Seite für Seite in einer Schleife zu verarbeiten und ein Formular nach dem anderen zu bearbeiten.
Weitere Informationen: Seitenbereich
Ich habe ein Dokumentverarbeitungsmodell trainiert, erhalte aber keine guten Ergebnisse, wenn es um extrahierte Daten geht. Wie kann ich das Modell verbessern?
Wenn Ihr Modell schlechte Ergebnisse liefert, nachdem Sie es trainiert haben, bearbeiten Sie das Modell und stellen Sie mehr Beispiele für das Training zur Verfügung. Je mehr Beispiele Sie bereitstellen, desto mehr lernt das KI-Modell, Daten aus Ihren Dokumenten zu extrahieren.
Weitere Informationen: Verbessern der Leistung Ihres Dokumentverarbeitungsmodells
Sie können alle 60 Sekunden bis zu 360 Dokumente pro Umgebung verarbeiten.
- Es kann vorkommen, dass einige Zeichen verwechselt werden: 0 (Zahl) und O (Buchstabe), 1 (Zahl) und l (Buchstabe), 4 (Zahl) und A (Buchstabe) und mehr.
- Es kann vorkommen, dass einige über oder nahe bei anderen liegende Zeichen falsch erkannt werden: O (Buchstabe) über einer vertikalen Linie wird zu einer 0 (Zahl), 5 (Zahl) über einer Linie wird zu einem $ (amerikanisches Dollarzeichen), l_ (Kleinbuchstabe, Unterstrich) wird zu einem L (Großbuchstabe) und mehr.
- Es kann vorkommen, dass bestimmte Zeichen auf Dokumenten schlechter Qualität falsch oder gar nicht erkannt werden.
In den oben genannten Fällen kann in AI Builder nichts unternommen werden, um die Erkennung zu verbessern. Wir empfehlen, die Qualität und das Layout des Quelldokuments zu verbessern, um ähnliche Probleme zu lösen.
Hinweis
Die OCR-Technologie zur Erkennung von Zeichen wird von Microsoft ständig verbessert, sodass solche Probleme seltener werden.
Sie können bis zu 200 Sammlungen pro Modell erstellen. Das Trainieren von Modellen mit Allgemeinen Dokumenten mit Dutzenden von Sammlungen kann jedoch mehrere Stunden dauern und in seltenen Fällen eine Zeitüberschreitung verursachen. Wenn Ihr Modell eine große Anzahl an Sammlungen enthält, müssen Sie mit einer Wartezeit von bis zu 24 Stunden rechnen, bis das Modelltraining abgeschlossen ist.
Derzeit ist es nicht möglich, ein Modell in einer Lösung zu erstellen.
Ja, unstrukturierte Dokumente wie Verträge und Briefe werden von der Dokumentenverarbeitung über die Option Allgemeine Dokumente unterstützt.
Was sind die Unterschiede zwischen Dokumentenverarbeitung, Rechnungsverarbeitung, Belegverarbeitung, Ausweis Leser, Visitenkarte Leser und Texterkennung?
Abhängig von Ihrer Situation müssen Sie möglicherweise ein bestimmtes Modell oder eine Kombination davon verwenden.
Verwenden Sie Texterkennung, wenn Sie den gesamten Text in einem Bild oder einer PDF-Datei extrahieren möchten. Sie können dann z. B. nach einem Schlüsselwort im extrahierten Text suchen oder einige feste Regeln aufstellen, um bestimmte Elemente zu extrahieren.
Wenn Sie Informationen aus Rechnungen, Quittungen, Pässen, Führerscheinen oder Visitenkarten extrahieren möchten, beginnen Sie mit dem entsprechenden vorgefertigten Modell:
- Rechnungsverarbeitung
- Belegverarbeitung
- Ausweisleser (Pässe und Führerscheine)
- Visitenkartenleser
Sie können diese vorgefertigten Modelle sofort verwenden, ohne ein neues Modell erstellen zu müssen. Diese Modelle können allgemeine Informationen extrahieren, die in dem entsprechenden Beleg zu finden sind.
Für jeden anderen Dokumenttyp können Sie ein benutzerdefiniertes Dokumentverarbeitungsmodell erstellen, um die benötigten Felder und Tabellen zu extrahieren. Dies gilt auch, wenn Sie zusätzliche Informationen benötigen, die das vorgefertigte Modell nicht bereitstellt.
Weitere Informationen: Benutzerdefiniertes Dokumentverarbeitungsmodell
AI Builder-Dokumentverarbeitung basiert auf der Azure-Formularerkennung. Dadurch erhalten beide Produkte die neuesten Fortschritte bei Microsoft AI.
AI Builder ist Teil der Microsoft Power Platform. Auf diese Weise kann jeder mit einer benutzerfreundlichen Oberfläche KI in Apps und Automatisierung integrieren. Sie müssen kein Entwickler und keine Wissenschaftliche Fachkraft für Daten sein.
Azure- Form Recognizer richtet sich an professionelle Entwickler. Sie können einfache REST-APIs verwenden, um ihren benutzerdefinierten Codelösungen KI-Funktionen hinzuzufügen.
Sie können die Dokumentenverarbeitung kostenlos ausprobieren, indem Sie eine Testversion starten. Nachdem Sie es getestet haben, müssen Sie AI Builder-Guthaben zur Verwendung der Dokumentverarbeitung kaufen. Jede Seite, die Sie mit der Dokumentverarbeitung verarbeiten, verbraucht AI Builder-Guthaben, auch wenn die Seite keine zu extrahierenden Daten enthält. AI Builder-Guthaben kann über AI Builder-Add-Ons erworben werden.
Mehr erfahren: AI Builder-Lizenzierung