Share via


Reconhecimento do produto (versão 4.0 preview)

As APIs de reconhecimento de produtos permitem analisar fotos de prateleiras em uma loja de varejo. Você pode detetar a presença de produtos e obter suas coordenadas de caixa delimitadora. Use-o em combinação com a personalização do modelo para treinar um modelo para identificar seus produtos específicos. Também pode comparar os resultados do Reconhecimento de Produtos com o documento de planograma da sua loja.

Experimente os recursos do Reconhecimento de Produtos de forma rápida e fácil em seu navegador usando o Vision Studio.

Foto de uma prateleira com produtos e lacunas delineadas em retângulos.

Nota

As marcas mostradas nas imagens não são afiliadas à Microsoft e não indicam qualquer forma de endosso dos produtos da Microsoft ou da Microsoft pelos proprietários da marca, ou um endosso dos proprietários da marca ou seus produtos pela Microsoft.

Importante

Você pode treinar um modelo personalizado para reconhecimento de produtos usando o serviço Visão Personalizada ou as APIs de Reconhecimento de Produto da Análise de Imagem 4.0. A tabela a seguir compara os dois serviços.

Áreas Produtos nas prateleiras – Visão Personalizada Reconhecimento de Produto – API de Análise de Imagem/Personalização
Funcionalidades Compreensão personalizada do produto Costura de imagem e retificação,
Compreensão pré-treinada do produto,
Compreensão personalizada do produto,
Correspondência de planograma
Modelo de base CNN Modelo de transformador de Florença
Etiquetagem Customvision.ai Estúdio AML
Portal Web Customvision.ai Estúdio Visão
Bibliotecas REST, SDK REST, exemplo de Python
Dados mínimos de formação necessários 15 imagens por categoria 2-5 imagens por categoria
Armazenamento dos dados de preparação Carregado para o serviço Conta de armazenamento de blob do cliente
Alojamento do modelo Nuvem e borda Somente hospedagem na nuvem, hospedagem de contêiner de borda por vir
Qualidade da IA
ContextoPrecisão top-1, 14 conjuntos de dados
1 shot (catálogo)29,4
2 tiros57.1
3 tiros66.7
5 tiros80.8
10 tiros86.4
completo94.9
ContextoPrecisão top-1, 14 conjuntos de dados
1 shot (catálogo)86.9
2 tiros88.8
3 tiros89.8
5 tiros90,3
10 tiros91.0
completo95,4
Preços Preços da Visão Personalizada Preços da Análise de Imagem

Recursos de reconhecimento de produtos

Composição da imagem de prateleira

As APIs de costura e retificação permitem modificar imagens para melhorar a precisão dos resultados de Compreensão do produto. Você pode usar essas APIs para:

  • Costurar várias imagens de uma prateleira para criar uma única imagem.
  • Retifique uma imagem para remover a distorção da perspetiva.

Reconhecimento de produtos de prateleira (modelo pré-treinado)

A API de Compreensão do Produto permite analisar uma imagem de prateleira usando o modelo pré-treinado pronto para uso. Esta operação deteta produtos e lacunas na imagem da prateleira e retorna as coordenadas da caixa delimitadora de cada produto e lacuna, juntamente com uma pontuação de confiança para cada um.

A resposta JSON a seguir ilustra o que a API de Compreensão do Produto retorna.

{
  "imageMetadata": {
    "width": 2000,
    "height": 1500
  },
  "products": [
    {
      "id": "string",
      "boundingBox": {
        "x": 1234,
        "y": 1234,
        "w": 12,
        "h": 12
      },
      "classifications": [
        {
          "confidence": 0.9,
          "label": "string"
        }
      ]
    }
  ],
  "gaps": [
    {
      "id": "string",
      "boundingBox": {
        "x": 1234,
        "y": 1234,
        "w": 123,
        "h": 123
      },
      "classifications": [
        {
          "confidence": 0.8,
          "label": "string"
        }
      ]
    }
  ]
}

Reconhecimento de produtos de prateleira (modelo personalizado)

A API de Compreensão do Produto também pode ser usada com um modelo treinado personalizado para detetar seus produtos específicos. Esta operação retorna as coordenadas da caixa delimitadora de cada produto e lacuna, juntamente com o rótulo de cada produto.

A resposta JSON a seguir ilustra o que a API de Compreensão do Produto retorna quando usada com um modelo personalizado.

"detectedProducts": {
  "imageMetadata": {
    "width": 21,
    "height": 25
  },
  "products": [
    {
      "id": "01",
      "boundingBox": {
        "x": 123,
        "y": 234,
        "w": 34,
        "h": 45
      },
      "classifications": [
        {
          "confidence": 0.8,
          "label": "Product1"
        }
      ]
    }
  ],
  "gaps": [
    {
      "id": "02",
      "boundingBox": {
        "x": 12,
        "y": 123,
        "w": 1234,
        "h": 123
      },
      "classifications": [
        {
          "confidence": 0.9,
          "label": "Product1"
        }
      ]
    }
  ]
}

Conformidade com planogramas de prateleira

A API de correspondência de planograma permite comparar os resultados da API de Compreensão do Produto com um documento de planograma. Esta operação faz corresponder cada produto detetado e lacuna à sua posição correspondente no documento de planograma.

Ele retorna uma resposta JSON que contabiliza cada posição no documento de planograma, seja ela ocupada por um produto ou lacuna.

{
  "matchedResultsPerPosition": [
    {
      "positionId": "01",
      "detectedObject": {
        "id": "01",
        "boundingBox": {
          "x": 12,
          "y": 1234,
          "w": 123,
          "h": 12345
        },
        "classifications": [
          {
            "confidence": 0.9,
            "label": "Product1"
          }
        ]
      }
    }
  ]
}

Limitações

  • O Reconhecimento de Produto só está disponível nas regiões Azure Leste dos EUA e Oeste dos EUA 2 .
  • As imagens de prateleira podem ter até 20 MB de tamanho. O tamanho recomendado é de 4 MB.
  • Recomendamos que você faça costura e retificação nas imagens de prateleira antes de enviá-las para análise.
  • O uso de um modelo personalizado é opcional no Reconhecimento de Produto, mas é necessário para a função de correspondência de planograma.

Próximos passos

Comece a usar o Reconhecimento de Produto experimentando as APIs de costura e retificação. Em seguida, faça uma análise básica com a API de Compreensão do Produto.