Resumo

Concluído

Observação

Consulte a guia Texto e imagens para obter mais detalhes!

Neste módulo, explorámos modelos com capacidade de visão no Microsoft Foundry e como os usar para analisar imagens e gerar imagens e vídeos originais.

O módulo abrangeu modelos multimodais, que suportam a análise de imagens. Também abordámos modelos de geração de imagens, como os da família GPT-Image, para criar e editar imagens a partir de prompts usando ferramentas e APIs Foundry. Finalmente, introduzimos a geração de vídeo com modelos Sora, que permitem a criação de texto para vídeo e imagem-vídeo através de playgrounds interativos e fluxos de trabalho programáticos e assíncronos REST.

No geral, os modelos de IA visual na Microsoft Foundry ajudam a colmatar a lacuna entre dados visuais e IA baseada em linguagem. Permitem cenários como análise de documentos e imagens, assistentes visuais, ferramentas de acessibilidade e agentes multimodais de IA — tornando a compreensão de imagens uma extensão natural das aplicações modernas de IA.

Para saber mais, consulte os seguintes links: