¿Qué es Computer Vision?
El servicio Computer Vision de Azure proporciona acceso a algoritmos avanzados que procesan imágenes y devuelven información basada en las características visuales de interés.
Servicio | Descripción |
---|---|
Reconocimiento óptico de caracteres (OCR) | El servicio de reconocimiento óptico de caracteres (OCR) extrae el texto de las imágenes. Puede usar la nueva Read API para extraer el texto impreso y manuscrito de imágenes y documentos. Usa modelos basados en aprendizaje profundo y funciona con texto en diversas superficies y fondos. Entre estos se incluyen documentos de la empresa, facturas, recibos, pósteres, tarjetas de presentación, cartas y pizarras. Las API de OCR admiten la extracción de texto impreso en varios idiomas. Siga nuestro inicio rápido con OCR para comenzar. |
Análisis de imágenes | El servicio Image Analysis extrae muchas características visuales de las imágenes, como objetos, caras, contenido para adultos y descripciones de texto generadas automáticamente. Siga los artículos de inicio rápido de Image Analysis para comenzar. |
Face | El servicio Face proporciona algoritmos de inteligencia artificial que detectan, reconocen y analizan caras humanas en una imagen. El software de reconocimiento facial es importante en muchos escenarios diferentes, como la verificación de identidad, el control de acceso sin contacto y el desenfoque facial para la privacidad. Siga el inicio rápido de Face para comenzar. |
Análisis espacial | El servicio de análisis espacial analiza la presencia y el movimiento de personas en una fuente de vídeo y genera eventos a los que pueden responder otros sistemas. Instale el contenedor de análisis espacial para comenzar. |
Computer Vision para la administración de activos digitales
Computer Vision puede funcionar en muchos escenarios de administración de activos digitales (DAM). DAM es el proceso empresarial de organización, almacenamiento y recuperación de recursos multimedia enriquecidos, y la administración de los permisos y derechos digitales. Por ejemplo, es posible que una empresa desee agrupar e identificar imágenes basadas en logotipos, caras, objetos, colores visibles, etc. O bien, puede que desee generar automáticamente leyendas para las imágenes y adjuntar palabras clave para que admitan búsquedas. Para una solución DAM todo en uno que use Cognitive Services, Azure Cognitive Search e informes inteligentes, vea la Guía del acelerador de la solución de minería del conocimiento en GitHub. Para ver otros ejemplos de DAM, consulte el repositorio plantillas de la solución Computer Vision.
Introducción
Use Vision Studio para probar las características de Computer Vision rápidamente en el explorador web.
Para empezar a compilar Computer Vision en la aplicación, siga un inicio rápido.
- Inicio rápido: Reconocimiento óptico de caracteres (OCR)
- Inicio rápido: Image Analysis
- Inicio rápido: Contenedor de análisis espacial
Requisitos de imagen
Computer Vision puede analizar las imágenes que cumplan los requisitos siguientes:
- La imagen se debe presentar en formato JPEG, PNG, GIF o BMP
- El tamaño de archivo de la imagen debe ser inferior a 4 megabytes (MB)
- Las dimensiones de la imagen deben ser mayores que 50 x 50 píxeles
- Para la API Read, las dimensiones de la imagen deben estar entre 50 x 50 y 10 000 x 10 000 píxeles.
Seguridad y privacidad de datos
Al igual que sucede con todas las instancias de Cognitive Services, los desarrolladores que usan el servicio Computer Vision deben estar al tanto de las directivas de Microsoft sobre los datos de clientes. Para más información, consulte la página de Cognitive Services en Microsoft Trust Center.
Pasos siguientes
Siga un inicio rápido para implementar y ejecutar un servicio en el lenguaje de desarrollo que prefiera.