Deteção de objetos

Este artigo explica o recurso de deteção de objetos. A deteção de objetos é semelhante à marcação, mas a API retorna as coordenadas da caixa delimitadora (em pixels) para cada objeto encontrado na imagem. Por exemplo, se uma imagem contiver um cão, gato e pessoa, a operação de deteção de objetos listará esses objetos com suas coordenadas na imagem.

Você pode usar essa funcionalidade para processar as relações entre os objetos em uma imagem. Ele também permite determinar se há várias instâncias do mesmo objeto em uma imagem.

Não há nenhuma relação formal entre a taxonomia de marcação e a taxonomia de deteção de objetos. Em um nível conceitual, a função de deteção de objetos só encontra objetos e seres vivos, enquanto a função de tag também pode incluir termos contextuais como indoor, que não podem ser localizados com caixas delimitadoras.

Exemplo de deteção de objetos

A resposta JSON a seguir mostra o que a API Analyze Image retorna quando deteta objetos na imagem de exemplo.

Fotografia que mostra uma mulher a utilizar um dispositivo Microsoft Surface numa cozinha.

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

Limitações

É importante observar as limitações da deteção de objetos para que você possa evitar ou mitigar os efeitos de falsos negativos (objetos perdidos) e detalhes limitados.

Os objetos geralmente não são detetados se forem pequenos (menos de 5% da imagem).
Os objetos geralmente não são detetados se estiverem dispostos juntos (uma pilha de placas, por exemplo).
Os objetos não são diferenciados por marcas ou nomes de produtos (diferentes tipos de refrigerantes na prateleira de uma loja, por exemplo). No entanto, pode obter informações da marca a partir de uma imagem com a funcionalidade Deteção de marcas.

Utilizar a API

O recurso de deteção de objetos faz parte da API Analyze Image . Você pode chamar essa API por meio de um SDK nativo ou por meio de chamadas REST. Inclua Objects no parâmetro visualFeatures de consulta. Em seguida, quando você obtiver a resposta JSON completa, analise a cadeia de caracteres para o conteúdo da seção de objetos .

Guia de início rápido: análise de imagem

Comentários

Esta página foi útil?

Last updated on 2026-02-25