Grundlagen der KI-Dokumentintelligenz
Azure KI Dokument Intelligenz ist einfach zu verwenden, aber um eine zuverlässige Lösung erstellen zu können, müssen Sie die zugehörigen Objekte verstehen, wie z. B. Modelle, APIs und Tools.
In Ihrem Umfrageinstitut bewerten Sie die Funktion „Azure KI Dokument Intelligenz“, um festzustellen, ob sie Ihren Workflow für die Dateneingabe optimieren kann. Sie müssen wissen, welche Daten Azure KI Dokument Intelligenz aus den verschiedenen von Ihnen verwendeten Umfrageformularen abrufen kann und wie Ihr Entwicklungsteam ein KI-Dateneingabesystem erstellt und in Ihre mobilen und Desktop-Apps und Datenbanken integriert.
In dieser Lektion erfahren Sie, welche Vorgänge Azure KI Dokument Intelligenz ausführt und wie Entwickler sie konfigurieren können, um ihre Formulare und Dokumente zu unterstützen.
Was ist Azure AI Document Intelligence?
Bis vor kurzem mussten Daten aus einem ausgefüllten Formular manuell in eine Datenbank oder einen anderen Datenspeicher eingegeben werden. Die manuelle Dateneingabe ist eine langwierige und arbeitsintensive Aufgabe und kann teuer sein, insbesondere wenn Tausende von Formularen eingegeben werden müssen. Den Personen, die die Daten eingeben, unterlaufen häufig Lese- oder Tippfehler, die die Genauigkeit Ihrer Daten verringern.
Die manuelle Dateneingabe war allerdings die einzige Option, da es für Computer schwierig war, gedruckten oder mit der Hand geschriebenen Text zu erkennen. Heute ist die KI alltäglich geworden und ermöglicht es Computern, Muster wie Buchstabenformen in einem Text mit hoher Genauigkeit zu erkennen. Wir können KI als Alternative zur manuellen Dateneingabe nutzen und von niedrigeren Kosten und weniger Fehlern in den extrahierten Daten profitieren.
Azure KI Dokument Intelligenz ist ein Azure-Dienst, mit dem Sie Formulare, die von Ihren Kunden, Partnern, Arbeitgebern oder anderen Personen ausgefüllt wurden, analysieren und die darin enthaltenen Daten extrahieren können.
Verantwortungsvolle Verwendung von KI
KI-Technologien sind leistungsfähig und bergen das Potenzial, umfassende Auswirkungen auf das Leben der Menschen zu haben. Um dafür zu sorgen, dass diese Auswirkungen positiv sind, wendet Microsoft beim Entwickeln und Aufbauen von KI-Lösungen die folgenden Prinzipien an. Sie sollten diese Prinzipien berücksichtigen, wenn Sie KI nutzen:
- Fairness. Alle KI-Systeme sollten Menschen gleich behandeln, unabhängig von Ethnie, Glauben, Geschlecht, Sexualität oder anderen Faktoren.
- Zuverlässigkeit und Sicherheit Alle KI-Systeme sollten zuverlässige Antworten mit quantifizierbaren Konfidenzniveaus geben.
- Datenschutz und -sicherheit Alle KI-Systeme sollten vertrauliche Daten sichern und schützen und im Rahmen der geltenden Datenschutzgesetze arbeiten.
- Inklusion Alle KI-Systeme sollten allen Benutzern zur Verfügung stehen, unabhängig von deren Fähigkeiten.
- Transparenz Alle KI-Systeme sollten verständlich und offen funktionieren.
- Verantwortlichkeit. Alle KI-Systeme sollten von Personen ausgeführt werden, die für die Aktionen dieser Systeme zur Verantwortung gezogen werden können.
Um diese Prinzipien zu befolgen, sollten Sie sich zunächst Zeit nehmen, um das von Ihnen verwendete KI-System zu verstehen und genau zu wissen, was es leisten kann. Stellen Sie beispielsweise bei Verwendung der Dokumentintelligenz sicher, dass Sie Ihre Lösung gründlich mit den Formularen testen, die gelesen werden sollen, um sicherzustellen, dass die erwarteten Daten extrahiert werden. Stellen Sie sicher, dass Sie in den Formularen nur die benötigten Daten erfassen und die Zustimmung der Benutzer eingeholt haben, dass Sie ihre Informationen speichern und analysieren dürfen. Lassen Sie sich juristisch zu Ihrer Lösung beraten, insbesondere dann, wenn die von der Lösung verarbeiteten Daten persönlich oder vertraulich sind. Beauftragen Sie weiterhin Menschen damit, das bereitgestellte System zu überprüfen, und stellen Sie sicher, dass Ihre Administratoren in die Lösung eingreifen können, um Schäden zu verhindern. Überprüfen Sie kontinuierlich die Sicherheit des Systems und seine Resilienz gegen böswillige Angriffe und versehentlichen Datenverlust.
Verwenden von Modellen mit Azure KI Dokument Intelligenz
Verwenden Sie ein Modell, um Azure KI Dokument Intelligenz den Datentyp mitzuteilen, den Sie in den zu analysierenden Dokumenten erwarten. Wenn Ihre Formulare eine einheitliche Struktur oder ein einheitliches Layout aufweisen, können Sie die Genauigkeit der Ergebnisse erhöhen und die Struktur der Ausgabedaten steuern, indem Sie das für Ihre Formulare am besten geeignete Modell einsetzen. Azure KI Dokument Intelligenz gibt Daten im JSON-Format aus, das mit vielen Datenbanken, anderen Speicherorten und Programmiersprachen kompatibel ist.
Azure KI Dokument Intelligenz enthält mehrere vordefinierte Modelle für allgemeine Arten von Formularen und Dokumenten. Wenn Sie eine solche Art von Formularen verwenden, können Sie Informationen daraus extrahieren, ohne eigene benutzerdefinierte Modelle trainieren zu müssen. In Azure KI Dokument Intelligenz lässt sich eine Lösung sehr schnell erstellen und bereitstellen, wenn Sie vordefinierte Modelle verwenden.
In Azure KI Dokument Intelligenz sind drei der vordefinierten Modelle für die allgemeine Dokumentanalyse vorgesehen:
- Lesen
- Allgemeines Dokument
- Layout
Die anderen vordefinierten Modelle erwarten eine allgemeine Art von Formular oder Dokument:
- Rechnung
- Rechnung
- US-amerikanisches W-2-Steuerformular
- Ausweisdokument
- Visitenkarte
- Krankenversicherungskarte
Wichtig
Diese Liste zeigt die dokumentierten vordefinierten Modelle, die zum Zeitpunkt der Erstellung dieses Dokuments verfügbar waren. Weitere vordefinierte Modelle befinden sich in der Entwicklungsphase und werden in Kürze bereitgestellt. Die neuesten Modelle finden Sie in der Dokumentation zu Azure KI Dokument Intelligenz.
Wenn Sie einen ungewöhnlichen oder einzigartigen Formulartyp verarbeiten möchten, können Sie die oben genannten vordefinierten Modelle für die allgemeine Dokumentanalyse verwenden, um Informationen zu extrahieren. Wenn Sie jedoch spezifischere Informationen extrahieren möchten als diejenigen, die von den vordefinierten Modellen unterstützt werden, können Sie ein benutzerdefiniertes Modell erstellen und es mithilfe von Beispielen ausgefüllter Formulare trainieren.
Sie können auch mehrere benutzerdefinierte Modelle, die mit verschiedenen Dokumenttypen trainiert wurden, zu einem einzelnen Modell zusammenfassen, das als zusammengesetztes Modell bezeichnet wird. Mit einem zusammengesetzten Modell können Benutzer unterschiedliche Arten von Formularen an einen einzigen Dienst übermitteln, der die Formulare identifiziert und das am besten geeignete benutzerdefinierte Modell für die Analyse auswählt.
Azure KI Dokument Intelligenz und Azure KI Vision
Als Azure AI Service ist Azure KI Dokument Intelligenz ein KI-Dienst auf hoher Ebene, mit dem Entwickler schnell auf Daten in Formularen zugreifen können. Sie baut auf den Azure KI Services auf, die sich auf einer tieferen Ebene befinden und die Azure KI Vision einschließen.
Wenn Sie Azure KI Vision mit dem zugehörigen Feature für die optische Zeichenerkennung (Optical Character Recognition, OCR) verwenden, können Sie fotografierte oder gescannte Dokumente übermitteln und die darin enthaltenen Texte im JSON-Format extrahieren. Diese Funktionalität ähnelt Azure KI Dokument Intelligenz und kann die Entscheidung zwischen diesen Diensten erschweren.
Wenn Sie einfache Texte aus einem Bild ohne weitere Kontextinformationen aus einem Formular oder Dokument extrahieren möchten, ist die optische Zeichenerkennung von Azure KI Vision ein geeigneter Dienst, der in Erwägung gezogen werden kann. Dieser Dienst kann sich beispielsweise anbieten, wenn Sie bereits über eigenen Analysecode verfügen. Azure KI Dokument Intelligenz umfasst jedoch eine komplexere Analyse von Dokumenten. Sie kann beispielsweise Schlüssel-Wert-Paare, Tabellen und kontextspezifische Felder identifizieren. Wenn Sie eine vollständige Dokumentanalyselösung bereitstellen möchten, mit der Benutzer Text extrahieren und verstehen können, ist Azure KI Dokument Intelligenz wahrscheinlich die bessere Wahl.
Azure KI Dokument Intelligenz-Tools
Wenn Sie viele Features von Azure KI Dokument Intelligenz ausprobieren möchten, ohne Code zu schreiben, können Sie Azure KI Dokument Intelligenz Studio verwenden. Dies bietet ein visuelles Tool zum Untersuchen und Verstehen der Funktionen von Azure KI Document Intelligence und deren Unterstützung für Ihre Formulare.
Sie können Azure KI Dokument Intelligenz Studio beispielsweise verwenden, um Ihre Verkaufsrechnungen zu analysieren und die Daten zu untersuchen, die vom vordefinierten Modell für Rechnungen erstellt wurden. Dann können Sie entscheiden, ob das vordefinierte Modell die benötigten Werte extrahiert oder ob Sie Ihr eigenes benutzerdefiniertes Modell für einen ungewöhnlicheren Rechnungstyp erstellen möchten.
Um Azure KI Dokument Intelligenz in Ihre eigenen Anwendungen zu integrieren, müssen Sie Code schreiben. Beispielsweise könnten Sie Benutzern Ihrer mobilen Vertriebs-App das Scannen von Belegen mit der Kamera ihres Geräts ermöglichen und dann Azure KI Dokument Intelligenz aufrufen, um Preise, Kosten und Kundendetails zu extrahieren. Die App könnte diese Informationen in Ihrer CRM-Datenbank speichern.
Azure KI Dokument Intelligenz enthält APIs (Application Programming Interfaces, Anwendungsprogrammierungsschnittstellen) für jeden der hier vorgestellten Modelltypen. Folgende Sprachen werden unterstützt:
- C#/.NET
- Java
- Python
- JavaScript
Wenn Sie eine andere Sprache verwenden möchten, können Sie Azure KI Dokument Intelligenz mithilfe des RESTful-Webdiensts aufrufen.
Weitere Informationen
- Was ist Azure AI Document Intelligence?
- Leitfaden für die Integration und verantwortungsvolle Verwendung von Azure KI Dokument Intelligenz
- Dokumentverarbeitungsmodelle
- Azure KI Dokument Intelligenz Studio (Vorschau)