Introdução

Concluído

Uma das ramificações bem-sucedidas da inteligência artificial é a pesquisa visual computacional, que permite ao computador obter insights de imagens digitais e/ou vídeos. As redes neurais podem ser usadas com êxito para tarefas de pesquisa visual computacional.

Imagine você está desenvolvendo um sistema para reconhecer texto impresso. Você usou uma abordagem de algoritmo para alinhar a página e recortar caracteres individuais no texto, e agora precisa reconhecer as letras individuais. Esse problema é chamado de classificação de imagem, pois precisamos separar as imagens de entrada em diferentes classes. Outros exemplos desse problema seriam classificar automaticamente cartões postais de acordo com a imagem ou determinar o tipo de produto em um sistema de entrega com base em uma fotografia.

Neste módulo, aprenderemos a treinar modelos de rede neural de classificação de imagem usando o PyTorch, uma das bibliotecas de Python mais populares para a criação de redes neurais. Vamos começar com o modelo mais simples – uma rede neural densa totalmente conectada – e um conjunto de dados do MNIST simples de dígitos manuscritos. Em seguida, aprenderemos sobre redes neurais convolucionais, que foram projetadas para capturar padrões de imagem 2D, e passar para um conjunto de dados mais complexo, o CIFAR-10. Por fim, usaremos redes pré-treinadas e transferência de aprendizado para treinar modelos em conjuntos de dados relativamente pequenos.

Ao final deste módulo, você poderá treinar modelos de classificação de imagem em fotos do mundo real, como o conjunto de dados de gatos e cachorros, e desenvolver classificadores de imagem para seus cenários.

Objetivos de aprendizagem

Neste módulo, você vai:

  • Saber mais sobre as tarefas de pesquisa visual computacional mais comumente resolvidas com redes neurais
  • Entender como as CNNs (Redes Neurais Convolucionais) funcionam
  • Treinar uma rede neural para reconhecer dígitos manuscritos e classificar gatos e cachorros
  • Saber como usar a Transferência de Aprendizado para resolver problemas de classificação do mundo real com PyTorch

Pré-requisitos

  • Conhecimento básico de Python e Jupyter Notebooks
  • Familiaridade com a estrutura PyTorch, incluindo tensores, noções básicas de propagação de retorno e criação de modelos
  • Noções básicas sobre conceitos de machine learning, como classificação, conjuntos de dados de treinamento/teste, precisão etc.