Utforska Azure AI Vision-alternativ för att läsa text

3 minuter

Azure AI innehåller två olika funktioner som läser text från dokument och bilder, den ena i Azure AI Vision Service, den andra i Azure AI Document Intelligence. Det finns överlappningar i vad varje tjänst tillhandahåller, men var och en är optimerad för resultat beroende på vad indata är.

Optisk teckenigenkänning för bildanalys (OCR):
- Använd den här funktionen för allmänna, ostrukturerade dokument med mindre mängd text eller bilder som innehåller text.
- Resultatet returneras omedelbart (synkront) från ett enda API-anrop.
- Har funktioner för att analysera bilder efter att ha extraherat text, inklusive objektidentifiering, beskriva eller kategorisera en bild, generera miniatyrbilder med smart beskärning med mera.
- Exempel är: gatuskyltar, handskrivna anteckningar och butiksskyltar.
Dokumentinformation:
- Använd den här tjänsten för att läsa små till stora mängder text från bilder och PDF-dokument.
- Den här tjänsten använder dokumentets kontext och struktur för att förbättra noggrannheten.
- Det första funktionsanropet returnerar ett asynkront åtgärds-ID som måste användas i ett efterföljande anrop för att hämta resultatet.
- Exempel är: kvitton, artiklar och fakturor.

Du kan komma åt båda teknikerna via REST-API:et eller ett klientbibliotek. I den här modulen fokuserar vi på OCR-funktionen i bildanalys. Om du vill veta mer om dokumentinformation får du en bra introduktion genom att läsa den här modulen.

Fortsätt

Utforska Azure AI Vision-alternativ för att läsa text

Feedback