Desarrollo de soluciones de Computer Vision en Azure

La visión informática es un área de la inteligencia artificial que se ocupa de la percepción visual. Azure AI incluye varios servicios que admiten escenarios comunes de Computer Vision.

Requisitos previos

Antes de iniciar esta ruta de aprendizaje, debe contar con lo siguiente:

  • Familiaridad con Azure y Azure Portal
  • Experiencia en programación con C# en Python.

Módulos en esta ruta de aprendizaje

Con el servicio Visión de Azure AI, puede usar modelos entrenados previamente para analizar imágenes y extraer información de ellas.

Azure AI Vision Image Analysis service usa algoritmos para procesar imágenes y devolver información. En este módulo se explica cómo usar la API de análisis de imágenes para el reconocimiento óptico de caracteres (OCR).

La capacidad de las aplicaciones para detectar caras humanas, analizar rasgos faciales y emociones e identificar individuos es una funcionalidad clave de la inteligencia artificial.

La clasificación de imágenes se usa para determinar el asunto principal de una imagen. Puede usar los servicios de Custom Vision de Azure AI para entrenar un modelo que clasifica las imágenes en función de sus propias categorizaciones.

La detección de objetos se usa para ubicar e identificar objetos en las imágenes. Puede utilizar Custom Vision de Azure AI para entrenar un modelo a fin de que detecte clases de objeto específicas en las imágenes.

Azure Video Indexer es un servicio para extraer información de vídeos, incluida la identificación de caras, el reconocimiento de texto, las etiquetas de objetos, las segmentaciones de escenas, etc.

Una imagen dice miles de palabras y los modelos de IA generativos multigenerativos pueden interpretar las imágenes para responder a las indicaciones visuales. Obtenga información sobre cómo crear aplicaciones de chat habilitadas para visión.

En Azure AI Foundry, puede usar modelos de generación de imágenes para crear imágenes originales basadas en avisos de lenguaje natural.