Compartilhar via


Classificação de imagem com a Visão Personalizada e o Windows Machine Learning

Fluxo de classificação de imagem

Este guia mostra como treinar um modelo de rede neural para classificar imagens de alimentos usando o serviço de Visão Personalizada do Azure; exportar o modelo para o formato ONNX; e implante o modelo em um aplicativo do Windows ML (Windows Machine Learning) em execução localmente em um dispositivo Windows. Você não precisa de nenhuma experiência anterior em machine learning! Guiaremos você passo a passo durante o processo.

Se você quiser aprender a criar e treinar um modelo com a Visão Personalizada, poderá prosseguir para Treinar um modelo.

Se você tiver um modelo e quiser aprender a criar um aplicativo do Windows ML do zero, confira o tutorial completo do aplicativo Windows ML.

Se você quiser começar com um projeto pré-existente do Visual Studio para um aplicativo do Windows ML, poderá clonar o aplicativo de exemplo de tutorial da Visão Personalizada e do Windows ML e usá-lo como ponto de partida.

Cenário

Neste tutorial, criaremos um aplicativo de classificação de alimentos de machine learning executado em dispositivos Windows. O modelo será treinado para reconhecer determinados tipos de padrões para classificar uma imagem de alimento e, quando receber uma imagem, retornará uma marca de classificação e o valor de confiança percentual associado dessa classificação.

Pré-requisitos para treinamento de modelo

Para criar e treinar um modelo, você precisará de uma assinatura para os serviços de Visão Personalizada do Azure.

Se você não estiver familiarizado com o Azure, poderá se inscrever em uma conta gratuita do Azure. Isso lhe dará a oportunidade de criar, treinar e implantar modelos de machine learning com a IA do Azure.

Dica

Você está interessado em saber mais sobre as opções de inscrição do Azure e as contas gratuitas do Azure? Em seguida, confira Criar uma conta do Azure.

Pré-requisitos para implantação de aplicativo do Windows ML

Para criar e implantar um aplicativo do Windows ML, você precisará do seguinte:

  • Windows 10, versão 1809 (build 17763) ou posterior. Você pode verificar o número da versão do build executando winver por meio do comando Executar (tecla de logotipo do Windows + R).
  • SDK do Windows para build 17763 ou posterior. Para baixar, consulte o SDK do Windows.
  • Visual Studio 2017 versão 15.7 ou posterior; mas recomendamos que você use o Visual Studio 2022 ou posterior. Algumas capturas de tela neste tutorial podem ser diferentes da interface do usuário que você verá. Para baixar o Visual Studio, consulte Downloads e ferramentas para desenvolvimento do Windows.
  • Extensão do Visual Studio do (mlgen) Gerador de Código do Windows ML (mlgen). Baixe-o para o Visual Studio 2019 ou posterior ou para o Visual Studio 2017.
  • Se você decidir criar um aplicativo da Plataforma Universal do Windows (UWP), precisará habilitar a carga de trabalho de desenvolvimento da Plataforma Universal do Windows no Visual Studio.
  • Habilitar o modo desenvolvedor em seu computador — consulte Habilitar seu dispositivo para desenvolvimento.

Observação

As APIs do Windows ML são integradas às versões mais recentes do Windows 10 (1809 ou superior) e do Windows Server 2019. Se sua plataforma de destino for uma versão mais antiga do Windows, você poderá portar seu aplicativo Windows ML para o pacote NuGet redistribuível (Windows 8.1 ou superior).

Preparar os dados

Os modelos de machine learning devem ser treinados com dados existentes. Neste guia, você usará um conjunto de dados de imagens de alimentos do Kaggle Open Datasets. Esse conjunto de dados é distribuído sob a licença de domínio público.

Importante

Para usar esse conjunto de dados, você precisa aderir ao termo de uso do site do Kaggle e aos termos de licença que acompanham o Food-11 próprio conjunto de dados. A Microsoft não faz nenhuma garantia ou representação sobre o site ou este conjunto de dados.

O conjunto de dados tem três divisões — avaliação, treinamento e validação — e contém 16.643 imagens de alimentos agrupadas em 11 categorias de alimentos principais. As imagens no conjunto de dados de cada categoria de alimento são colocadas em uma pasta separada, o que torna o processo de treinamento do modelo mais conveniente.

Baixe o conjunto de dados do conjunto de dados de imagem Food-11. O conjunto de dados tem cerca de 1 GB de tamanho e você pode ser solicitado a criar uma conta no site do Kaggle para baixar os dados.

Conjunto de dados de imagens de alimentos

Se preferir, você será bem-vindo a usar qualquer outro conjunto de dados de imagens relevantes. No mínimo, recomendamos que você use pelo menos 30 imagens por etiqueta no conjunto de treinamento inicial. Você também desejará coletar algumas imagens extras para testar seu modelo depois que ele for treinado.

Além disso, verifique se todas as suas imagens de treinamento atendem aos seguintes critérios:

  • .jpg, .pngou .bmp.gif formato.
  • Não maior que 6 MB de tamanho (4 MB para imagens de previsão).
  • Nada menos que 256 pixels na borda mais curta; qualquer imagem menor do que isso será automaticamente ampliada pelo Serviço de Visão Personalizada.

Próximas etapas

Agora que você classificou seus pré-requisitos e preparou seu conjunto de dados, poderá prosseguir para a criação do modelo do Windows ML. Na próxima parte (Treinar seu modelo com a Visão Personalizada), você usará a interface de Visão Personalizada baseada na Web para criar e treinar seu modelo de classificação.