Resumo

1 minuto

Observação

Consulte a guia Texto e imagens para obter mais detalhes!

Neste módulo, explorámos modelos com capacidade de visão no Microsoft Foundry e como os usar para analisar imagens e gerar imagens e vídeos originais.

O módulo abrangeu modelos multimodais, que suportam a análise de imagens. Também abordámos modelos de geração de imagens, como os da família GPT-Image, para criar e editar imagens a partir de prompts usando ferramentas e APIs Foundry. Finalmente, introduzimos a geração de vídeo com modelos Sora, que permitem a criação de texto para vídeo e imagem-vídeo através de playgrounds interativos e fluxos de trabalho programáticos e assíncronos REST.

No geral, os modelos de IA visual na Microsoft Foundry ajudam a colmatar a lacuna entre dados visuais e IA baseada em linguagem. Permitem cenários como análise de documentos e imagens, assistentes visuais, ferramentas de acessibilidade e agentes multimodais de IA — tornando a compreensão de imagens uma extensão natural das aplicações modernas de IA.

Para saber mais, consulte os seguintes links:

Experimenta um início rápido de análise de imagem na documentação.
Saiba mais sobre modelos de chat com capacidade de visão.
Saiba mais sobre modelos de geração de imagens Azure OpenAI.
Saiba mais sobre geração de vídeo com a Sora.

Comentários

Esta página foi útil?