Guia de Início Rápido: Criar um modelo de classificação de imagens com o portal de Visão Personalizada

Artigo
01/21/2024

Neste guia de início rápido, você aprenderá a usar o portal da Web de Visão Personalizada para criar um modelo de classificação de imagens. Depois de criar um modelo, você poderá testá-lo com novas imagens e, eventualmente, integrá-lo ao próprio aplicativo de reconhecimento de imagem.

Se você não tiver uma assinatura do Azure, crie uma conta gratuita antes de começar.

Pré-requisitos

Um conjunto de imagens com o qual treinar o seu modelo de classificação. Você pode usar o conjunto de imagens de exemplo no GitHub. Ou pode escolher suas próprias imagens usando as dicas abaixo.
Um navegador da Web com suporte

Criar recursos de Visão Personalizada

Para usar o Serviço de Visão Personalizada, você precisará criar os recursos de Treinamento e Previsão da Visão Personalizada no Azure. Para fazer isso no portal do Azure, preencha a janela da caixa de diálogo na página Criar Visão Personalizada para criar um recurso de treinamento e de previsão.

Criar um novo projeto

No navegador da Web, navegue até o site Visão Personalizada e selecione Entrar. Entre com a mesma conta usada para entrar no portal do Azure.

Image of the sign-in page

Para criar seu primeiro projeto, selecione Novo Projeto. A caixa de diálogo Criar projeto aparecerá.
Insira um nome e uma descrição para o projeto. Em seguida, selecione seu Recurso de Treinamento de Visão Personalizada. Se a sua conta conectada estiver associada a uma conta do Azure, a lista suspensa Recurso exibe todos os recursos compatíveis do Azure.

Observação

Se nenhum recurso estiver disponível, confirme se você fez logon em customvision.ai com a mesma conta que foi usada para entrar no portal do Azure. Além disso, confirme se você selecionou o mesmo "Diretório" no site da Visão Personalizada como o diretório no portal do Azure em que os recursos da Visão Personalizada estão localizados. Em ambos os sites, é possível selecionar seu diretório no menu suspenso de conta no canto superior direito da tela.
Selecione Classificação em Tipos de Projeto. Em Tipos de Classificação, escolha Multirótulo ou Multiclasse, dependendo do seu caso de uso. A classificação multirótulo aplica qualquer número de marcas a uma imagem (zero ou mais), enquanto a classificação multiclasse agrupa as imagens em categorias únicas (cada imagem enviada será classificada de acordo com a marca mais provável). Você poderá alterar o tipo de classificação posteriormente, se quiser.

Em seguida, selecione um dos domínios disponíveis. Cada domínio otimiza o modelo para tipos específicos de imagens, conforme descrito na tabela a seguir. Você poderá alterar o domínio posteriormente se desejar.

Domínio	Finalidade
Genérico	Otimizado para uma ampla gama de tarefas de classificação de imagens. Se nenhum dos outros domínios for apropriado ou se você não tiver certeza de qual domínio escolher, selecione o domínio Genérico.
Alimentos	Otimizado para fotografias de pratos como você os veria no menu de um restaurante. Caso queira classificar fotografias de frutas ou legumes individuais, use o domínio Alimentos.
Pontos de referência	Otimizado para pontos de referência reconhecidos, tanto naturais quanto artificiais. Este domínio funciona melhor quando o ponto de referência está claramente visível na fotografia. Este domínio funciona mesmo quando o ponto de referência está um pouco obstruído devido a pessoas na frente dele.
Varejo	Otimizado para imagens encontradas em um catálogo ou site de compras. Caso deseje uma classificação de alta precisão entre vestidos, calças e camisas, use esse domínio.
Domínios compactos	Otimizados para as restrições de classificação em tempo real em dispositivos móveis. Os modelos gerados por domínios compactos podem ser exportados para serem executados localmente.

Por fim, selecione Criar projeto.

Escolher imagens de treinamento

É recomendável usar pelo menos 30 imagens por marca no conjunto de treinamento inicial. Também é conveniente coletar algumas imagens adicionais para testar o seu modelo após o treinamento.

Para treinar o seu modelo com eficiência, use imagens com variedade de visual. Selecione imagens com variação em:

ângulo da câmera
iluminação
background
estilo do visual
assuntos individuais/agrupados
tamanho
type

Além disso, certifique-se de que todas as suas imagens de treinamento atendam aos seguintes critérios:

Formato .jpg, .png, .bmp ou .gif
não ultrapasse 6 MB em tamanho (4 MB para imagens de previsão)
não tenha menos de 256 pixels na borda mais curta; qualquer imagem menor que isso será escalada verticalmente de maneira automática pelo Serviço de Visão Personalizada

Carregar e marcar imagens

Nesta seção, você carrega e marca manualmente imagens para ajudar a treinar o classificador.

Para adicionar imagens, selecione Adicionar imagens e selecione Procurar arquivos locais. Selecione Abrir para mover para a marcação. A sua escolha de marcas é aplicada a todo o grupo de imagens selecionado para upload, de modo que é mais fácil carregar imagens em grupos separados de acordo com as respectivas marcas aplicadas. Você também poderá alterar as marcas das imagens individuais depois que elas forem carregadas.
Para criar uma marca, digite o texto no campo Minhas Marcas e pressione Enter. Se a marca já existir, ela aparecerá em um menu suspenso. Em um projeto multirótulo, é possível adicionar mais de uma marca às suas imagens, mas em um projeto multiclasse, só é possível adicionar uma. Para finalizar o carregamento das imagens, use o botão Carregar [número] arquivos.
Selecione Concluído depois que as imagens forem carregadas.

Para carregar outro conjunto de imagens, retorne ao topo desta seção e repita as etapas.

Treinar o classificador

Para treinar o classificador, selecione o botão Treinar. O classificador usa todas as imagens atuais para criar um modelo que identifique as qualidades visuais de cada marca. Esse processo pode levar vários minutos.

The train button in the top right of the web page's header toolbar

O processo de treinamento deve levar apenas alguns minutos. Durante esse tempo, informações sobre o processo de treinamento são exibidas na barra Desempenho.

The browser window with a training dialog in the main section

Avaliar o classificador

Depois que o treinamento estiver concluído, o desempenho do modelo será estimado e exibido. O Serviço de Visão Personalizada usa as imagens que você enviou para treinamento para calcular a precisão e a recuperação. A precisão e a recuperação são duas medidas diferentes da eficácia de um classificador:

A precisão indica a fração de classificações identificadas que estão corretas. Por exemplo, se o modelo identificou 100 imagens como cachorros e 99 delas são realmente de cachorros, a precisão é de 99%.
A recuperação indica a fração de classificações reais que foram corretamente identificadas. Por exemplo, se há de fato 100 imagens de maçãs e o modelo identifica 80 como maçãs, a recuperação é de 80%.

The training results show the overall precision and recall, and the precision and recall for each tag in the classifier.

Limite de probabilidade

Observe o controle deslizante Limite de Probabilidade no painel à esquerda da guia Desempenho. Esse é o nível de confiança que uma previsão precisa ter para ser considerada correto (para fins de cálculo de precisão e recall).

Quando você interpreta chamadas de previsão com um limite de probabilidade alto, elas tendem a retornar resultados com alta precisão às custas do recall – as classificações detectadas são corretas, mas muitas permanecem não detectadas. Um limite de probabilidade baixo tem o resultado oposto – a maior parte das classificações reais é detectada, mas há outros falsos positivos dentro desse conjunto. Com isso em mente, você deve definir o limite de probabilidade de acordo com as necessidades específicas do seu projeto. Posteriormente, ao receber os resultados de previsão no lado do cliente, você deve usar o mesmo valor de limite de probabilidade usado aqui.

Gerenciar iterações de treinamento

Toda vez que você treina o classificador, cria uma iteração com métricas de desempenho atualizadas. É possível exibir todas as iterações no painel à esquerda da guia Desempenho. Também é possível encontrar o botão Excluir, que pode ser usado para excluir uma iteração se ela estiver obsoleta. Ao excluir uma iteração, você exclui qualquer imagem que esteja exclusivamente associada a ela.

Confira Usar o modelo com a API de previsão para saber como acessar seus modelos treinados de maneira programática.

Próximas etapas

Neste guia de início rápido, você aprendeu a criar e treinar um modelo de classificação de imagem usando o portal da Web de Visão Personalizada. A seguir, saiba mais sobre o processo iterativo para melhorar o seu modelo.

Testar e readaptar um modelo

O que é Visão Personalizada?