Resumo
Observação
Consulte a guia Texto e imagens para obter mais detalhes!
Neste módulo, explorámos modelos com capacidade de visão no Microsoft Foundry e como os usar para analisar imagens e gerar imagens e vídeos originais.
O módulo abrangeu modelos multimodais, que suportam a análise de imagens. Também abordámos modelos de geração de imagens, como os da família GPT-Image, para criar e editar imagens a partir de prompts usando ferramentas e APIs Foundry. Finalmente, introduzimos a geração de vídeo com modelos Sora, que permitem a criação de texto para vídeo e imagem-vídeo através de playgrounds interativos e fluxos de trabalho programáticos e assíncronos REST.
No geral, os modelos de IA visual na Microsoft Foundry ajudam a colmatar a lacuna entre dados visuais e IA baseada em linguagem. Permitem cenários como análise de documentos e imagens, assistentes visuais, ferramentas de acessibilidade e agentes multimodais de IA — tornando a compreensão de imagens uma extensão natural das aplicações modernas de IA.
Para saber mais, consulte os seguintes links:
- Experimenta um início rápido de análise de imagem na documentação.
- Saiba mais sobre modelos de chat com capacidade de visão.
- Saiba mais sobre modelos de geração de imagens Azure OpenAI.
- Saiba mais sobre geração de vídeo com a Sora.