Explorar las opciones de Visión de Azure AI para leer texto

3 minutos

Azure AI proporciona dos características diferentes que leen texto de documentos e imágenes, una a través del servicio Visión de Azure AI y la otra mediante Documento de inteligencia de Azure AI. Hay superposición sobre lo que proporciona cada servicio, pero cada uno está optimizado para los resultados en función de lo que sea la entrada.

Reconocimiento óptico de caracteres (OCR) de análisis de imágenes:
- Use esta característica para documentos generales y no estructurados que tengan menor cantidad de texto, o bien para imágenes que contengan texto.
- Los resultados se devuelven de forma inmediata (sincrónica) desde una única llamada de API.
- Tiene funcionalidad para analizar imágenes además de extraer texto, incluyendo la detección de objetos, la descripción o clasificación de una imagen, la generación de miniaturas recortadas inteligentemente y mucho más.
- Entre los ejemplos, se incluyen los signos callejeros, las notas manuscritas y los signos de almacén.
Documento de inteligencia:
- Use este servicio para leer volúmenes pequeños y grandes de texto de imágenes y documentos PDF.
- Este servicio usa el contexto y la estructura del documento para mejorar la precisión.
- La llamada de función inicial devuelve un identificador de operación asincrónica, que se debe usar en una llamada posterior para recuperar los resultados.
- Algunos ejemplos son: recibos, artículos y facturas.

Puede acceder a ambas tecnologías a través de la API de REST o una biblioteca cliente. En este módulo, nos centraremos en la característica OCR de Análisis de imágenes. Si desea obtener más información sobre la inteligencia de documentos, la lectura de este módulo le proporcionará una buena introducción.

Continuar

Explorar las opciones de Visión de Azure AI para leer texto

Comentarios