Resumo

1 minuto

Observação

Consulte a guia Texto e imagens para obter mais detalhes!

Neste módulo, exploramos modelos com capacidade de visão no Microsoft Foundry e como usá-los para analisar imagens e gerar imagens e vídeos originais.

O módulo abordou modelos multimodal, que dão suporte à análise de imagem. Também abordamos modelos de geração de imagens, como os da família GPT-Image, para criar e editar imagens de prompts usando ferramentas e APIs do Foundry. Por fim, introduzimos a geração de vídeo com modelos sora, que permitem a criação de texto para vídeo e imagem em vídeo por meio de playgrounds interativos e fluxos de trabalho REST assíncronos e programáticos.

No geral, os modelos de IA visual no Microsoft Foundry ajudam a preencher a lacuna entre os dados visuais e a IA baseada em linguagem. Eles habilitam cenários como análise de documentos e imagens, assistentes visuais, ferramentas de acessibilidade e agentes de IA multimodal, tornando a compreensão da imagem uma extensão natural de aplicativos de IA modernos.

Para saber mais, confira os seguintes links:

Experimente um início rápido de análise de imagem na documentação.
Saiba mais sobre modelos de chat assistidos por visão.
Saiba mais sobre os modelos de geração de imagem do Azure OpenAI.
Saiba mais sobre a geração de vídeo com Sora.

Comentários

Esta página foi útil?