Partilhar via


Deteção de objetos

Este artigo explica o conceito de deteção de objetos. A deteção de objetos é semelhante à marcação, mas a API retorna as coordenadas da caixa delimitadora (em pixels) para cada objeto encontrado na imagem. Por exemplo, se uma imagem contiver um cão, gato e pessoa, a operação de deteção de objetos listará esses objetos com suas coordenadas na imagem. Você pode usar essa funcionalidade para processar as relações entre os objetos em uma imagem. Ele também permite determinar se há várias instâncias do mesmo objeto em uma imagem.

A função de deteção de objetos aplica tags com base nos objetos ou seres vivos identificados na imagem. Não há nenhuma relação formal entre a taxonomia de marcação e a taxonomia de deteção de objetos. Em um nível conceitual, a função de deteção de objetos só encontra objetos e seres vivos, enquanto a função de tag também pode incluir termos contextuais como indoor, que não podem ser localizados com caixas delimitadoras.

Experimente os recursos de deteção de objetos de forma rápida e fácil em seu navegador usando o Azure AI Vision Studio.

Exemplo de deteção de objetos

A resposta JSON a seguir mostra o que a API Analyze Image retorna quando deteta objetos na imagem de exemplo.

Fotografia que mostra uma mulher a utilizar um dispositivo Microsoft Surface numa cozinha.

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

Limitações

É importante observar as limitações da deteção de objetos para que você possa evitar ou mitigar os efeitos de falsos negativos (objetos perdidos) e detalhes limitados.

  • Os objetos geralmente não são detetados se forem pequenos (menos de 5% da imagem).
  • Os objetos geralmente não são detetados se estiverem dispostos juntos (uma pilha de placas, por exemplo).
  • Os objetos não são diferenciados por marcas ou nomes de produtos (diferentes tipos de refrigerantes na prateleira de uma loja, por exemplo). No entanto, pode obter informações da marca a partir de uma imagem com a funcionalidade Deteção de marcas.

Utilizar a API

O recurso de deteção de objetos faz parte da API Analyze Image . Você pode chamar essa API por meio de um SDK nativo ou por meio de chamadas REST. Inclua Objects no visualFeatures parâmetro de consulta. Em seguida, quando você obtiver a resposta JSON completa, analise a cadeia de caracteres para o conteúdo da seção de objetos .