Quickstart: Construir um modelo de classificação de imagem com o portal Visão Personalizada

Neste arranque rápido, você vai aprender a usar o portal web Visão Personalizada para criar um modelo de classificação de imagem. Uma vez construído um modelo, pode testá-lo com novas imagens e eventualmente integrá-lo na sua própria app de reconhecimento de imagem.

Se não tiver uma subscrição do Azure, crie uma conta gratuita antes de começar.

Pré-requisitos

Criar recursos Visão Personalizada

Para utilizar o Serviço de Visão Personalizada, terá de criar recursos de formação e previsão Visão Personalizada em Azure. Para fazê-lo no portal do Azure, preencha a janela de diálogo na página Create Visão Personalizada para criar um recurso de Formação e Previsão.

Criar um novo projeto

No seu navegador web, navegue para a página web Visão Personalizada e selecione Iniciar sôm. Inscreva-se com a mesma conta que usou para assinar no portal do Azure.

Imagem da página de inscrição

  1. Para criar o seu primeiro projeto, selecione New Project. Aparecerá a nova caixa de diálogo do projeto Create .

    A nova caixa de diálogo do projeto tem campos para nome, descrição e domínios.

  2. Insira um nome e uma descrição para o projeto. Em seguida, selecione o seu Visão Personalizada Recurso de Formação. Se a sua conta de assinatura estiver associada a uma conta Azure, a entrega de recursos apresentará todos os seus recursos Azure compatíveis.

    Nota

    Se não houver recurso disponível, por favor confirme que iniciou sessão no customvision.ai com a mesma conta que usou para iniciar sessão no portal do Azure. Além disso, confirme que selecionou o mesmo "Diretório" no site da Visão Personalizada que o diretório da portal do Azure onde estão os seus recursos Visão Personalizada. Em ambos os sites, pode selecionar o seu diretório a partir do menu de conta drop down no canto superior direito do ecrã.

  3. Selecione classificação em tipos de projeto. Em seguida, nos Tipos de Classificação, escolha multilabel ou multiclasse, dependendo da sua caixa de utilização. A classificação multilabel aplica qualquer número das suas tags a uma imagem (zero ou mais), enquanto a classificação multiclasse classifica as imagens em categorias únicas (cada imagem que submeter será classificada na etiqueta mais provável). Poderá alterar o tipo de classificação mais tarde, se quiser.

  4. Em seguida, selecione um dos domínios disponíveis. Cada domínio otimiza o modelo para tipos específicos de imagens, conforme descrito na tabela seguinte. Pode alterar o domínio mais tarde, se desejar.

    Domínio Objetivo
    Genérica Otimizado para uma ampla gama de tarefas de classificação de imagem. Se nenhum dos outros domínios for apropriado, ou se não tiver a certeza de qual domínio escolher, selecione o domínio Genérico.
    Comida Otimizado para fotografias de pratos como você os veria no menu de um restaurante. Se quiser classificar fotografias de frutas ou vegetais individuais, utilize o domínio Food.
    Pontos de referência Otimizado para marcos reconhecíveis, tanto naturais como artificiais. Este domínio funciona melhor quando o marco é claramente visível na fotografia. Este domínio funciona mesmo que o marco seja ligeiramente obstruído por pessoas à sua frente.
    Retail Otimizado para imagens que são encontradas em um catálogo de compras ou site de compras. Se quiser classificar de alta precisão entre vestidos, calças e camisas, use este domínio.
    Domínios compactos Otimizado para os constrangimentos da classificação em tempo real em dispositivos móveis. Os modelos gerados por domínios compactos podem ser exportados para serem executados localmente.
  5. Finalmente, selecione Criar projeto.

Escolha imagens de treino

No mínimo, recomendamos que utilize pelo menos 30 imagens por tag no conjunto de treino inicial. Também vai querer recolher algumas imagens extras para testar o seu modelo uma vez treinado.

Para treinar eficazmente o seu modelo, utilize imagens com variedade visual. Selecione imagens que variam por:

  • ângulo da câmera
  • iluminação
  • fundo
  • estilo visual
  • sujeito individual/agrupado
  • size
  • tipo

Além disso, certifique-se de que todas as suas imagens de treino cumprem os seguintes critérios:

  • .jpg, .png, .bmp ou .gif formato
  • não superior a 6MB de tamanho (4MB para imagens de previsão)
  • nada menos que 256 pixels na borda mais curta; quaisquer imagens mais curtas do que esta serão automaticamente dimensionada pelo Serviço de Visão Personalizada

Enviar e marcar imagens

Nesta secção, você carregará e marcará manualmente imagens para ajudar a treinar o classificador.

  1. Para adicionar imagens, selecione Adicionar imagens e, em seguida, selecione procurar ficheiros locais. Selecione Open para mover-se para a marcação. A sua seleção de etiquetas será aplicada a todo o grupo de imagens que selecionou para carregar, por isso é mais fácil fazer upload de imagens em grupos separados de acordo com as suas etiquetas aplicadas. Também pode alterar as etiquetas para imagens individuais depois de serem carregadas.

    O controlo de imagens adicionais é mostrado na parte superior esquerda, e como um botão no centro inferior.

  2. Para criar uma etiqueta, introduza texto no campo 'As etiquetas ' e prima Enter. Se a etiqueta já existir, aparecerá num menu suspenso. Num projeto multilabel, pode adicionar mais do que uma etiqueta às suas imagens, mas num projeto multiclasse pode adicionar apenas uma. Para terminar o upload das imagens, utilize o botão de ficheiros Upload [número ].

    Imagem da etiqueta e página de upload

  3. Selecione Fazer uma vez que as imagens tenham sido carregadas.

    A barra de progresso mostra todas as tarefas concluídas.

Para carregar outro conjunto de imagens, volte ao topo desta secção e repita os passos.

Preparar o classificador

Para treinar o classificador, selecione o botão Train . O classificador utiliza todas as imagens atuais para criar um modelo que identifique as qualidades visuais de cada tag. Este processo pode demorar vários minutos.

O botão do comboio no direito superior da barra de ferramentas do cabeçalho da página web

O processo de treino deve demorar apenas alguns minutos. Durante este tempo, as informações sobre o processo de treino são apresentadas no separador Performance .

A janela do navegador com um diálogo de treino na secção principal

Avaliar o classificador

Após o treino ter terminado, o desempenho do modelo é estimado e exibido. O Serviço Visão Personalizada utiliza as imagens que submeteu para treino para calcular a precisão e a recuperação. Precisão e recordação são duas medições diferentes da eficácia de um classificador:

  • Precisão indica a fração de classificações identificadas que estavam corretas. Por exemplo, se o modelo identificasse 100 imagens como cães, e 99 delas fossem realmente de cães, então a precisão seria de 99%.
  • A recolha indica a fração de classificações reais que foram corretamente identificadas. Por exemplo, se houvesse realmente 100 imagens de maçãs, e o modelo identificasse 80 como maçãs, a recuperação seria de 80%.

Os resultados da formação mostram a precisão e a recuperação globais, e a precisão e a recuperação de cada etiqueta no classificador.

Limiar de probabilidade

Note o slider do limiar de probabilidade no painel esquerdo do separador Desempenho . Este é o nível de confiança que uma previsão deve ter para ser considerada correta (para efeitos de cálculo da precisão e da recordação).

Quando interpreta chamadas de previsão com um limiar de alta probabilidade, tendem a devolver resultados com alta precisão à custa da recuperação — as classificações detetadas estão corretas, mas muitas permanecem indetetáveis. Um limiar de baixa probabilidade faz o oposto - a maioria das classificações reais são detetadas, mas há mais falsos positivos dentro desse conjunto. Com isto em mente, deve definir o limiar de probabilidade de acordo com as necessidades específicas do seu projeto. Mais tarde, quando estiver a receber os resultados da previsão do lado do cliente, deve utilizar o mesmo valor limiar de probabilidade que utilizou aqui.

Gerir iterações de formação

Cada vez que treina o seu classificador, cria uma nova iteração com métricas de desempenho atualizadas. Pode ver todas as suas iterações no painel esquerdo do separador Performance . Também encontrará o botão Eliminar , que pode utilizar para eliminar uma iteração se for obsoleto. Quando elimina uma iteração, apaga-se quaisquer imagens que estejam exclusivamente associadas a ela.

Consulte o seu modelo com a API de previsão para aprender a aceder programaticamente aos seus modelos treinados.

Passos seguintes

Neste arranque rápido, aprendeu a criar e treinar um modelo de classificação de imagem usando o portal web Visão Personalizada. Em seguida, obtenha mais informações sobre o processo iterativo de melhorar o seu modelo.

Test and retrain a model (Testar e voltar a preparar um modelo)