Detecção de objetos

Artigo
05/28/2024

A detecção de objetos é semelhante à marcação, mas a API retorna as coordenadas da caixa delimitadora (em pixels) para cada objeto encontrado na imagem. Por exemplo, se uma imagem contém um cachorro, um gato e uma pessoa, a operação de detecção de objetos lista esses objetos com suas coordenadas na imagem. Você pode usar essa funcionalidade para processar as relações entre os objetos em uma imagem. Ela também permite saber se há várias instâncias do mesmo objeto em uma imagem.

A função de detecção de objetos aplica marcas com base em objetos ou seres vivos identificados na imagem. Não há relação formal entre a taxonomia de marcação e a taxonomia de detecção de objetos. Em um nível conceitual, a função de detecção de objetos encontra apenas objetos e seres vivos, enquanto a função de tag também pode incluir termos contextuais como “interno”, que não podem ser localizados com caixas delimitadoras.

Experimente as funcionalidades da detecção de objetos de maneira rápida e fácil no navegador usando o Vision Studio.

Experimentar o Vision Studio

Exemplo de detecção de objetos

A resposta JSON a seguir ilustra o que a API Analyze Image retorna ao detectar objetos na imagem de exemplo.

Uma mulher usando um dispositivo Microsoft Surface em uma cozinha

{
   "objects":[
      {
         "rectangle":{
            "x":730,
            "y":66,
            "w":135,
            "h":85
         },
         "object":"kitchen appliance",
         "confidence":0.501
      },
      {
         "rectangle":{
            "x":523,
            "y":377,
            "w":185,
            "h":46
         },
         "object":"computer keyboard",
         "confidence":0.51
      },
      {
         "rectangle":{
            "x":471,
            "y":218,
            "w":289,
            "h":226
         },
         "object":"Laptop",
         "confidence":0.85,
         "parent":{
            "object":"computer",
            "confidence":0.851
         }
      },
      {
         "rectangle":{
            "x":654,
            "y":0,
            "w":584,
            "h":473
         },
         "object":"person",
         "confidence":0.855
      }
   ],
   "requestId":"25018882-a494-4e64-8196-f627a35c1135",
   "metadata":{
      "height":473,
      "width":1260,
      "format":"Jpeg"
   },
   "modelVersion":"2021-05-01"
}

Limitações

É importante observar as limitações da detecção de objetos para que seja possível evitar ou reduzir os efeitos de falsos negativos (objetos ausentes) e a limitação de detalhes.

Os objetos geralmente não são detectados se forem pequenos (menos de 5% da imagem).
Os objetos geralmente não são detectados se estiverem dispostos próximos uns dos outros (uma pilha de pratos, por exemplo).
Os objetos não são diferenciados por marcas ou nomes de produtos (diferentes tipos de refrigerantes na prateleira de uma loja, por exemplo). No entanto, você pode obter informações sobre a marca de uma imagem usando o recurso Detecção de marca.

Usar a API

O recurso de detecção de objeto faz parte da API Analisar Imagem. Você pode chamar essa API por meio de um SDK nativo ou por meio de chamadas REST. Inclua Objects no parâmetro de consulta visualFeatures. Em seguida, quando receber a resposta JSON completa, basta analisar a cadeia de caracteres para o conteúdo da seção "objects".

Início Rápido: API REST da Visão de IA ou bibliotecas de clientes

Share via

Detecção de objetos

Exemplo de detecção de objetos

Limitações

Usar a API

Recursos adicionais