Erkunden von Azure AI Vision-Optionen zum Lesen von Text
Azure AI bietet zwei verschiedene Features, die Text aus Dokumenten und Bildern lesen, eines im Azure AI Vision Service, der andere in Azure AI Document Intelligence. Es gibt Überlappungen in den einzelnen Diensten, die jedoch für Ergebnisse optimiert sind, je nachdem, was die Eingabe ist.
-
Bildanalyse optische Zeichenerkennung (OCR):
- Verwenden Sie dieses Feature für allgemeine, unstrukturierte Dokumente mit geringerer Textmenge oder Bildern, die Text enthalten.
- Ergebnisse werden sofort (synchron) aus einem einzelnen API-Aufruf zurückgegeben.
- Verfügt über Funktionen zum Analysieren von Bildern, die über das Extrahieren von Text hinausgegangen sind, einschließlich Objekterkennung, Beschreiben oder Kategorisieren eines Bilds, Generieren von smart zugeschnittenen Miniaturansichten und mehr.
- Beispiele sind: Straßenschilder, handschriftliche Notizen und Speicherschilder.
-
Document Intelligence-:
- Verwenden Sie diesen Dienst, um kleine bis große Textmengen aus Bildern und PDF-Dokumenten zu lesen.
- Dieser Dienst verwendet Kontext und Struktur des Dokuments, um die Genauigkeit zu verbessern.
- Der anfängliche Funktionsaufruf gibt eine asynchrone Vorgangs-ID zurück, die in einem nachfolgenden Aufruf verwendet werden muss, um die Ergebnisse abzurufen.
- Beispiele sind: Belege, Artikel und Rechnungen.
Sie können über die REST-API oder eine Clientbibliothek auf beide Technologien zugreifen. In diesem Modul konzentrieren wir uns auf das OCR-Feature in Bildanalyse. Wenn Sie mehr über Document Intelligenceerfahren möchten, bieten Lesen dieses Moduls eine gute Einführung.