Resumen

1 minuto

Nota:

Consulte la pestaña Texto e imágenes para obtener más detalles.

En este módulo, hemos explorado modelos compatibles con la visión en Microsoft Foundry y cómo usarlos para analizar imágenes y generar imágenes y vídeos originales.

En el módulo se trataron modelos multimodales, que admiten el análisis de imágenes. También se trataron modelos de generación de imágenes, como los de la familia GPT-Image, para crear y editar imágenes a partir de mensajes mediante herramientas y API de Foundry. Por último, se introdujo la generación de vídeos con modelos sora, que permiten la creación de texto a vídeo e imagen a vídeo a través de juegos interactivos y flujos de trabajo REST asincrónicos y mediante programación.

En general, los modelos de IA visual de Microsoft Foundry ayudan a salvar la brecha entre los datos visuales y la inteligencia artificial basada en lenguaje. Habilitan escenarios como el análisis de documentos e imágenes, asistentes visuales, herramientas de accesibilidad y agentes de inteligencia artificial multiplataforma, lo que hace que la imagen comprenda una extensión natural de las aplicaciones de inteligencia artificial modernas.

Para más información, consulte los vínculos siguientes:

Pruebe un inicio rápido de análisis de imágenes desde la documentación.
Obtenga más información sobre los modelos de chat con capacidad de visión.
Obtenga más información sobre los modelos de generación de imágenes de Azure OpenAI.
Obtenga más información sobre la generación de vídeos con Sora.

Comentarios

¿Le ha resultado útil esta página?