Einführung

2 Minuten

Angenommen, Sie erhalten Tausende von Bildern und werden gebeten, den Text auf den Bildern in eine Computerdatenbank zu übertragen. Die gescannten Bilder enthalten Text in verschiedenen Formaten und mehreren Sprachen. Wie können Sie das Projekt in einem angemessenen Zeitraum abschließen und sicherstellen, dass die Daten mit einem hohen Maß an Genauigkeit eingegeben werden?

Unternehmen auf der ganzen Welt suchen tagtäglich nach Lösungen für ähnliche Szenarien. Ohne KI-Dienste wäre es schwierig, ein solches Projekt durchzuführen. Dies gilt insbesondere bei variierendem Umfang.

Mithilfe von KI-Diensten können wir dieses Projekt als Azure KI Vision-Szenario behandeln und die optische Zeichenerkennung (Optical Character Recognition, OCR) nutzen. Die OCR ermöglicht es Ihnen, Text aus Bildern zu extrahieren, zum Beispiel Fotos von Straßenschildern und Produkten sowie aus Dokumenten, wie handschriftlichen oder unstrukturierten Dokumenten.

Zum Erstellen einer automatisierten KI-Lösung müssen Sie Machine Learning-Modelle trainieren, die möglichst viele Anwendungsfälle abdecken. Der Azure KI Vision-Dienst bietet Zugriff auf erweiterte Algorithmen für die Verarbeitung von Bildern. Daten werden in einen sicheren Speicher zurückgegeben.

In diesem Modul lernen Sie Folgendes:

Ermitteln, wie Sie mit dem Azure KI Vision-Dienst Text aus Bildern lesen können
Verwenden des Azure KI Vision-Diensts mit SDKs und der REST-API
Entwickeln einer Anwendung, die gedruckten und handschriftlichen Text lesen kann

Weiter

Feedback