¿Qué es Visión de Azure AI?

Artículo
09/03/2024

El servicio de Visión de Azure AI proporciona acceso a algoritmos avanzados que procesan imágenes y devuelven información basada en las características visuales de interés. En la tabla siguiente se enumeran las principales categorías de productos.

Servicio	Descripción
Reconocimiento óptico de caracteres (OCR)	El servicio de reconocimiento óptico de caracteres (OCR) extrae el texto de las imágenes. Puede usar la Read API para extraer el texto impreso y manuscrito de imágenes y documentos. Usa modelos basados en aprendizaje profundo y trabaja con texto en varias superficies y fondos. Entre estos se incluyen documentos de la empresa, facturas, recibos, pósteres, tarjetas de presentación, cartas y pizarras. Las API de OCR admiten la extracción de texto impreso en varios idiomas. Siga nuestro inicio rápido con OCR para comenzar.
Análisis de imágenes	El servicio Image Analysis extrae muchas características visuales de las imágenes, como objetos, caras, contenido para adultos y descripciones de texto generadas automáticamente. Siga los artículos de inicio rápido de Image Analysis para comenzar.
Face	El servicio Face proporciona algoritmos de inteligencia artificial que detectan, reconocen y analizan caras humanas en una imagen. El software de reconocimiento facial es importante en muchos escenarios diferentes, como la identificación, el control de acceso sin contacto y el desenfoque facial para la privacidad. Siga el inicio rápido de Face para comenzar.
Análisis de vídeo	El Análisis de vídeo incluye características relacionadas con vídeo, como Análisis espacial y Recuperación de vídeo. El Análisis espacial analiza la presencia y el movimiento de personas en una fuente de vídeo y genera eventos a los que pueden responder otros sistemas. Instale el contenedor de análisis espacial para comenzar. La Recuperación de vídeo le permite crear un índice de vídeos que puede buscar con lenguaje natural.

Visión de Azure AI para la administración de activos digitales

Visión de Azure AI puede funcionar en muchos escenarios de administración de activos digitales (DAM). DAM es el proceso empresarial de organización, almacenamiento y recuperación de recursos multimedia enriquecidos, y la administración de los permisos y derechos digitales. Por ejemplo, es posible que una empresa desee agrupar e identificar imágenes basadas en logotipos, caras, objetos, colores visibles, etc. O bien, puede que desee generar automáticamente leyendas para las imágenes y adjuntar palabras clave para que admitan búsquedas. Para una solución DAM todo en uno que use los servicios de Azure AI, Azure AI Search e informes inteligentes, consulte la Guía del acelerador de soluciones de minería del conocimiento en GitHub. Para ver otros ejemplos de DAM, consulte el repositorio plantillas de la solución Visión de Azure AI.

Introducción

Use Vision Studio para probar las características de Visión de Azure AI rápidamente en el explorador web.

Para empezar a compilar Visión de Azure AI en la aplicación, siga el inicio rápido.

Requisitos de imagen

Visión de Azure AI puede analizar las imágenes que cumplan los requisitos siguientes:

La imagen se debe presentar en formato JPEG, PNG, GIF o BMP
El tamaño de archivo de la imagen debe ser inferior a 4 megabytes (MB)
Las dimensiones de la imagen deben ser mayores que 50 x 50 píxeles
- Para la Read API, las dimensiones de la imagen deben estar entre 50 x 50 y 10 000 x 10 000 píxeles.

Seguridad y privacidad de datos

Al igual que sucede con todas las instancias de servicios de Azure AI, los desarrolladores que usan el servicio Visión de Azure AI deben estar al tanto de las directivas de Microsoft sobre los datos de clientes. Para más información, consulte la página de servicios de Azure AI en Microsoft Trust Center.

Pasos siguientes

Siga un inicio rápido para implementar y ejecutar un servicio en el lenguaje de desarrollo que prefiera.

Compartir vía