Share via


Legendas de imagem (versão 4.0)

As legendas de imagem da Análise de Imagem 4.0 estão disponíveis por meio dos recursos Legenda e Legendas Densas.

A legenda gera uma descrição de uma só frase para todo o conteúdo da imagem. O recurso Dense Captions fornece mais detalhes gerando descrições de uma só frase de até dez regiões da imagem, além de descrever toda a imagem. As Legendas Densas também retornam coordenadas de caixas delimitadoras das regiões descritas na imagem. Ambos os recursos usam os mais recentes modelos de IA revolucionários baseados no Florence.

No momento, a legendagem de imagens está disponível apenas em inglês.

Importante

A legendagem de imagens no Image Analysis 4.0 está disponível apenas nas seguintes regiões de data center do Azure: Leste dos EUA, França Central, Coreia Central, Norte da Europa, Sudeste da Ásia, Oeste da Europa, Oeste dos EUA, Leste da Ásia. Você precisa usar um recurso da Visão do Azure localizado em uma dessas regiões para obter resultados dos recursos de Legenda Oculta e Legendas Densas.

Se você precisar usar um recurso da Visão do Azure fora dessas regiões para gerar legendas de imagem, use a Análise de Imagem 3.2, que está disponível em todas as regiões da Visão de IA do Azure.

Experimente os recursos de legenda de imagem de maneira rápida e fácil no navegador usando o Vision Studio.

Legendas neutras em relação a gênero

Todas as legendas contêm termos de gênero ("homem", "mulher", "menino" e "menina") por padrão. Você tem a opção de substituir esses termos por "pessoa" nos resultados e receber legendas neutras em relação a gênero. Você pode fazer isso definindo o parâmetro de solicitação de API opcional, gender-neutral-caption como true na URL da solicitação.

Exemplos de legendas e legendas densas

A resposta JSON a seguir ilustra o que a API de Análise 4.0 retorna ao descrever a imagem de exemplo com base nos recursos visuais.

Photo of a man pointing at a screen

"captions": [
    {
        "text": "a man pointing at a screen",
        "confidence": 0.4891590476036072
    }
]

Usar a API

O recurso de descrição de imagem faz parte da API de Análise de Imagem. Inclua Caption no parâmetro de consulta features. Em seguida, quando receber a resposta JSON completa, basta analisar a cadeia de caracteres para o conteúdo da seção "captionResult".

Próximas etapas