Utforska Azure AI Vision-alternativ för att läsa text

Slutförd

Azure AI innehåller två olika funktioner som läser text från dokument och bilder, den ena i Azure AI Vision Service, den andra i Azure AI Document Intelligence. Det finns överlappningar i vad varje tjänst tillhandahåller, men var och en är optimerad för resultat beroende på vad indata är.

  • Optisk teckenigenkänning för bildanalys (OCR):
    • Använd den här funktionen för allmänna, ostrukturerade dokument med mindre mängd text eller bilder som innehåller text.
    • Resultatet returneras omedelbart (synkront) från ett enda API-anrop.
    • Har funktioner för att analysera bilder efter att ha extraherat text, inklusive objektidentifiering, beskriva eller kategorisera en bild, generera miniatyrbilder med smart beskärning med mera.
    • Exempel är: gatuskyltar, handskrivna anteckningar och butiksskyltar.
  • Dokumentinformation:
    • Använd den här tjänsten för att läsa små till stora mängder text från bilder och PDF-dokument.
    • Den här tjänsten använder dokumentets kontext och struktur för att förbättra noggrannheten.
    • Det första funktionsanropet returnerar ett asynkront åtgärds-ID som måste användas i ett efterföljande anrop för att hämta resultatet.
    • Exempel är: kvitton, artiklar och fakturor.

Du kan komma åt båda teknikerna via REST-API:et eller ett klientbibliotek. I den här modulen fokuserar vi på OCR-funktionen i bildanalys. Om du vill veta mer om dokumentinformation får du en bra introduktion genom att läsa den här modulen.