Resumen
Nota:
Consulte la pestaña Texto e imágenes para obtener más detalles.
En este módulo, hemos explorado modelos compatibles con la visión en Microsoft Foundry y cómo usarlos para analizar imágenes y generar imágenes y vídeos originales.
En el módulo se trataron modelos multimodales, que admiten el análisis de imágenes. También se trataron modelos de generación de imágenes, como los de la familia GPT-Image, para crear y editar imágenes a partir de mensajes mediante herramientas y API de Foundry. Por último, se introdujo la generación de vídeos con modelos sora, que permiten la creación de texto a vídeo e imagen a vídeo a través de juegos interactivos y flujos de trabajo REST asincrónicos y mediante programación.
En general, los modelos de IA visual de Microsoft Foundry ayudan a salvar la brecha entre los datos visuales y la inteligencia artificial basada en lenguaje. Habilitan escenarios como el análisis de documentos e imágenes, asistentes visuales, herramientas de accesibilidad y agentes de inteligencia artificial multiplataforma, lo que hace que la imagen comprenda una extensión natural de las aplicaciones de inteligencia artificial modernas.
Para más información, consulte los vínculos siguientes:
- Pruebe un inicio rápido de análisis de imágenes desde la documentación.
- Obtenga más información sobre los modelos de chat con capacidad de visión.
- Obtenga más información sobre los modelos de generación de imágenes de Azure OpenAI.
- Obtenga más información sobre la generación de vídeos con Sora.