Descrições da imagem

A Visão de IA do Azure pode analisar uma imagem e gerar uma frase legível por humanos que descreve seu conteúdo. O algoritmo retorna várias descrições com base em recursos visuais diferentes e cada descrição recebe uma pontuação de confiança. A saída final é uma lista de descrições ordenadas do maior para o menor nível de confiança.

No momento, para a descrição da imagem, o inglês é o único idioma com suporte.

Experimente os recursos de legenda de imagem de maneira rápida e fácil no navegador usando o Vision Studio.

Exemplo de descrição de imagem

A resposta JSON a seguir ilustra o que a API de Análise retorna ao descrever a imagem de exemplo com base em seus recursos visuais.

Uma imagem em preto e branco dos edifícios em Manhattan

{
   "description":{
      "tags":[
         "outdoor",
         "city",
         "white"
      ],
      "captions":[
         {
            "text":"a city with tall buildings",
            "confidence":0.48468858003616333
         }
      ]
   },
   "requestId":"7e5e5cac-ef16-43ca-a0c4-02bd49d379e9",
   "metadata":{
      "height":300,
      "width":239,
      "format":"Png"
   },
   "modelVersion":"2021-05-01"
}

Usar a API

O recurso de descrição de imagem faz parte da API Analisar Imagem. Você pode chamar essa API por meio de um SDK nativo ou por meio de chamadas REST. Inclua Description no parâmetro de consulta visualFeatures. Em seguida, quando receber a resposta JSON completa, basta analisar a cadeia de caracteres para o conteúdo da seção "description".

Próximas etapas

Aprenda os conceitos relacionados a marcação de imagens e categorização de imagens.