Partilhar via


Deteção de objetos

A deteção de objetos é semelhante à marcação, mas a API retorna as coordenadas da caixa delimitadora (em pixels) para cada objeto encontrado na imagem. Por exemplo, se uma imagem contiver um cão, gato e pessoa, a operação de deteção de objetos listará esses objetos com suas coordenadas na imagem. Você pode usar essa funcionalidade para processar as relações entre os objetos em uma imagem. Ele também permite determinar se há várias instâncias do mesmo objeto em uma imagem.

A função de deteção de objetos aplica tags com base nos objetos ou seres vivos identificados na imagem. Não há nenhuma relação formal entre a taxonomia de marcação e a taxonomia de deteção de objetos. Em um nível conceitual, a função de deteção de objetos só encontra objetos e seres vivos, enquanto a função de tag também pode incluir termos contextuais como "indoor", que não podem ser localizados com caixas delimitadoras.

Experimente os recursos de deteção de objetos de forma rápida e fácil em seu navegador usando o Vision Studio.

Exemplo de deteção de objetos

A resposta JSON a seguir ilustra o que a API Analyze Image retorna ao detetar objetos na imagem de exemplo.

Uma mulher usando um dispositivo Microsoft Surface em uma cozinha

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

Limitações

É importante observar as limitações da deteção de objetos para que você possa evitar ou mitigar os efeitos de falsos negativos (objetos perdidos) e detalhes limitados.

  • Os objetos geralmente não são detetados se forem pequenos (menos de 5% da imagem).
  • Os objetos geralmente não são detetados se estiverem dispostos juntos (uma pilha de placas, por exemplo).
  • Os objetos não são diferenciados por marcas ou nomes de produtos (diferentes tipos de refrigerantes na prateleira de uma loja, por exemplo). No entanto, pode obter informações da marca a partir de uma imagem com a funcionalidade Deteção de marcas.

Utilizar a API

O recurso de deteção de objetos faz parte da API Analyze Image . Você pode chamar essa API por meio de um SDK nativo ou por meio de chamadas REST. Inclua Objects no parâmetro de consulta visualFeatures . Em seguida, quando você obtiver a resposta JSON completa, analise a cadeia de caracteres para o conteúdo da "objects" seção.