Introdução à classificação de imagens no Azure

Concluído

Você pode utilizar o Visão de IA do Azure para realizar a classificação de imagens, disponível como parte das ofertas dos Serviços de IA do Azure. Isso é geralmente mais fácil e rápido do que escrever o próprio código de treinamento de modelo e permite que pessoas com pouca ou nenhuma experiência em machine learning criem uma solução de classificação de imagens efetiva.

Recursos do Azure para Visão Personalizada de IA do Azure

Criar uma solução de classificação de imagens com o Visão Personalizada de IA do Azure consiste em duas tarefas principais. Primeiro, você precisa usar imagens existentes para treinar o modelo, depois, precisa publicar o modelo para que os aplicativos cliente possam usá-lo para gerar previsões.

Para cada uma dessas tarefas, você precisa de um recurso em sua assinatura do Azure. É possível usar os seguintes tipos de recursos:

  • Visão Personalizada: Um recurso dedicado para o serviço de visão personalizado, que pode ser um recurso de treinamento, uma previsão ou ambos.
  • Serviços de IA do Azure: Um recurso geral que inclui Visão Personalizada de IA do Azure juntamente com muitos outros serviços de IA do Azure. Você pode usar esse tipo de recurso para treinamento, previsão ou ambos.

A separação de recursos de treinamento e previsão será útil quando você quiser acompanhar a utilização de recursos para o treinamento de modelos separadamente de aplicativos cliente usando o modelo para prever classes de imagem. No entanto, ela pode tornar o desenvolvimento de uma solução de classificação de imagens um pouco confuso.

A abordagem mais simples é usar um recurso geral dos serviços de IA do Azure para treinamento e previsão. Isso significa que você só precisa se preocupar com um ponto de extremidade (o endereço HTTP em que seu serviço está hospedado) e uma chave (um valor secreto usado para os aplicativos cliente se autenticarem).

Se você quiser criar um recurso de Visão Personalizada, escolha treinamento, previsão ou ambos. É importante observar que, se você escolher "ambos", dois recursos serão criados: um para treinamento e o outro para previsão.

Também é possível adotar uma abordagem mista, na qual você usa um recurso dedicado de Visão Personalizada para treinamento, mas implanta seu modelo em um recurso de serviços de IA do Azure para previsão. Para que isso funcione, os recursos de treinamento e previsão precisam ser criados na mesma região.

Treinamento de modelos

Para treinar um modelo de classificação, você precisa carregar imagens para seu recurso de treinamento e rotulá-las com os rótulos de classe apropriados. Em seguida, você precisa treinar o modelo e avaliar os resultados de treinamento.

Você pode realizar essas tarefas no portal do Visão Personalizada ou, se tiver a experiência de codificação necessária, pode utilizar um dos kits de desenvolvimento de software (SDKs) específicos da linguagem de programação do serviço de Visão Personalizada de IA do Azure.

Uma das principais considerações quando você usa imagens para classificação é garantir que você tenha imagens suficientes dos objetos em questão e que essas imagens devam ser do objeto de vários ângulos diferentes.

Avaliação de modelos

O processo de treinamento do modelo é um processo iterativo no qual o serviço de Visão Personalizada de IA do Azure treina repetidamente o modelo utilizando alguns dos dados, mas retém alguns para avaliar o modelo. Ao final do processo de treinamento, o desempenho do modelo treinado é indicado pelas seguintes métricas de avaliação:

  • Precisão: Qual percentual das previsões de classe feitas pelo modelo estava correta? Por exemplo, se o modelo prevê que dez imagens são laranjas, das quais oito eram mesmo laranjas, a precisão é de 0,8 (80%).
  • Recall: Que percentual de previsões de classe o modelo identificou corretamente? Por exemplo, se houver dez imagens de maçãs e o modelo tiver encontrado sete delas, o recall será de 0,7 (70%).
  • AP (precisão média): uma métrica geral que leva em consideração a precisão e o recall.

Usar o modelo para previsão

Depois que você tiver treinado o modelo e estiver satisfeito com o desempenho avaliado dele, poderá publicar o modelo em seu recurso de previsão. Ao publicar o modelo, você pode atribuir um nome a ele (o padrão é "IteraçãoX", em que X é o número de vezes que você treinou o modelo).

Para usar seu modelo, os desenvolvedores de aplicativos cliente precisam das seguintes informações:

  • ID de Projeto: a ID exclusiva do projeto de Visão Personalizada que você criou para treinar o modelo.
  • Nome do modelo: o nome que você atribuiu ao modelo durante a publicação.
  • Ponto de extremidade de previsão: o endereço HTTP dos pontos de extremidade do recurso de previsão no qual você publicou o modelo (não o recurso de treinamento).
  • Chave de previsão: a chave de autenticação do recurso de previsão no qual você publicou o modelo (não o recurso de treinamento).