Resumo

Concluído

Observação

Consulte a guia Texto e imagens para obter mais detalhes!

Neste módulo, exploramos modelos com capacidade de visão no Microsoft Foundry e como usá-los para analisar imagens e gerar imagens e vídeos originais.

O módulo abordou modelos multimodal, que dão suporte à análise de imagem. Também abordamos modelos de geração de imagens, como os da família GPT-Image, para criar e editar imagens de prompts usando ferramentas e APIs do Foundry. Por fim, introduzimos a geração de vídeo com modelos sora, que permitem a criação de texto para vídeo e imagem em vídeo por meio de playgrounds interativos e fluxos de trabalho REST assíncronos e programáticos.

No geral, os modelos de IA visual no Microsoft Foundry ajudam a preencher a lacuna entre os dados visuais e a IA baseada em linguagem. Eles habilitam cenários como análise de documentos e imagens, assistentes visuais, ferramentas de acessibilidade e agentes de IA multimodal, tornando a compreensão da imagem uma extensão natural de aplicativos de IA modernos.

Para saber mais, confira os seguintes links: