Resumen

Completado

Nota:

Consulte la pestaña Texto e imágenes para obtener más detalles.

En este módulo, hemos explorado modelos compatibles con la visión en Microsoft Foundry y cómo usarlos para analizar imágenes y generar imágenes y vídeos originales.

En el módulo se trataron modelos multimodales, que admiten el análisis de imágenes. También se trataron modelos de generación de imágenes, como los de la familia GPT-Image, para crear y editar imágenes a partir de mensajes mediante herramientas y API de Foundry. Por último, se introdujo la generación de vídeos con modelos sora, que permiten la creación de texto a vídeo e imagen a vídeo a través de juegos interactivos y flujos de trabajo REST asincrónicos y mediante programación.

En general, los modelos de IA visual de Microsoft Foundry ayudan a salvar la brecha entre los datos visuales y la inteligencia artificial basada en lenguaje. Habilitan escenarios como el análisis de documentos e imágenes, asistentes visuales, herramientas de accesibilidad y agentes de inteligencia artificial multiplataforma, lo que hace que la imagen comprenda una extensión natural de las aplicaciones de inteligencia artificial modernas.

Para más información, consulte los vínculos siguientes: