Deteção de objetos (versão 4.0)

A deteção de objetos é semelhante à marcação, mas a API retorna as coordenadas da caixa delimitadora (em pixels) para cada objeto encontrado na imagem. Por exemplo, se uma imagem contiver um cão, gato e pessoa, a operação de deteção de objetos listará esses objetos com suas coordenadas na imagem. Você pode usar essa funcionalidade para processar as relações entre os objetos em uma imagem. Ele também permite determinar se há várias instâncias do mesmo objeto em uma imagem.

A função de deteção de objetos aplica tags com base nos objetos ou seres vivos identificados na imagem. Não há relação formal entre a taxonomia de marcação e a taxonomia de deteção de objetos. Em um nível conceitual, a função de deteção de objetos só encontra objetos e seres vivos, enquanto a função de tag também pode incluir termos contextuais como "indoor", que não podem ser localizados com caixas delimitadoras.

Experimente os recursos de deteção de objetos de forma rápida e fácil em seu navegador usando o Vision Studio.

Gorjeta

Você pode usar o recurso de deteção de objeto por meio do serviço Azure OpenAI . O modelo GPT-4 Turbo with Vision permite conversar com um assistente de IA que pode analisar as imagens que você compartilha, e a opção Vision Enhancement usa a Análise de Imagem para fornecer à assistência de IA mais detalhes (texto legível e locais de objetos) sobre a imagem. Para obter mais informações, consulte o Guia de início rápido GPT-4 Turbo com Visão.

Exemplo de deteção de objetos

A resposta JSON a seguir ilustra o que a API do Analysis 4.0 retorna ao detetar objetos na imagem de exemplo.

A woman using a Microsoft Surface device in a kitchen

{
    "metadata":
    {
        "width": 1260,
        "height": 473
    },
    "objectsResult":
    {
        "values":
        [
            {
                "name": "kitchen appliance",
                "confidence": 0.501,
                "boundingBox": {"x":730,"y":66,"w":135,"h":85}
            },
            {
                "name": "computer keyboard",
                "confidence": 0.51,
                "boundingBox": {"x":523,"y":377,"w":185,"h":46}
            },
            {
                "name": "Laptop",
                "confidence": 0.85,
                "boundingBox": {"x":471,"y":218,"w":289,"h":226}
            },
            {
                "name": "person",
                "confidence": 0.855,
                "boundingBox": {"x":654,"y":0,"w":584,"h":473}
            }
        ]
    }
}

Limitações

É importante observar as limitações da deteção de objetos para que você possa evitar ou mitigar os efeitos de falsos negativos (objetos perdidos) e detalhes limitados.

  • Os objetos geralmente não são detetados se forem pequenos (menos de 5% da imagem).
  • Os objetos geralmente não são detetados se estiverem dispostos juntos (uma pilha de placas, por exemplo).
  • Os objetos não são diferenciados por marca ou nomes de produtos (diferentes tipos de refrigerantes na prateleira de uma loja, por exemplo). No entanto, você pode obter informações de marca de uma imagem usando o recurso de deteção de marca.

Utilizar a API

O recurso de deteção de objetos faz parte da API Analyze Image . Você pode chamar essa API usando REST. Inclua Objects no parâmetro de consulta de recursos . Em seguida, quando você obtiver a resposta JSON completa, analise a cadeia de caracteres para o conteúdo da "objects" seção.

Próximos passos