Resumo
Observação
Consulte a guia Texto e imagens para obter mais detalhes!
Neste módulo, exploramos modelos com capacidade de visão no Microsoft Foundry e como usá-los para analisar imagens e gerar imagens e vídeos originais.
O módulo abordou modelos multimodal, que dão suporte à análise de imagem. Também abordamos modelos de geração de imagens, como os da família GPT-Image, para criar e editar imagens de prompts usando ferramentas e APIs do Foundry. Por fim, introduzimos a geração de vídeo com modelos sora, que permitem a criação de texto para vídeo e imagem em vídeo por meio de playgrounds interativos e fluxos de trabalho REST assíncronos e programáticos.
No geral, os modelos de IA visual no Microsoft Foundry ajudam a preencher a lacuna entre os dados visuais e a IA baseada em linguagem. Eles habilitam cenários como análise de documentos e imagens, assistentes visuais, ferramentas de acessibilidade e agentes de IA multimodal, tornando a compreensão da imagem uma extensão natural de aplicativos de IA modernos.
Para saber mais, confira os seguintes links:
- Experimente um início rápido de análise de imagem na documentação.
- Saiba mais sobre modelos de chat assistidos por visão.
- Saiba mais sobre os modelos de geração de imagem do Azure OpenAI.
- Saiba mais sobre a geração de vídeo com Sora.