Introdução

Concluído

O Python é uma das linguagens de programação mais populares do mundo. Ele é usado extensivamente na comunidade de ciência de dados para análise estatística e aprendizado de máquina. Um dos motivos pelos quais ele é tão popular é a disponibilidade de milhares de bibliotecas de software livre, tais como NumPy, Pandas, Matplotlib e Scikit-learn, que permitem tanto aos programadores quanto aos pesquisadores explorar, transformar, analisar e visualizar dados.

O Azure Notebooks é uma plataforma baseada em nuvem para criação e execução de Jupyter Notebooks. O Jupyter é um ambiente com base em IPython que facilita a programação interativa e a análise de dados usando o Python e outras linguagens de programação. O Azure Notebooks fornece o Jupyter como um serviço gratuito. É um modo prático de escrever código Python sem precisar instalar e gerenciar um servidor do Jupyter. Ele também é baseado na Web, tornando-o uma solução ideal para colaboração online.

Neste módulo, você criará um Azure Notebook, importará um conjunto de dados que contém informações de chegada no horário para uma grande companhia aérea dos EUA e carregará o conjunto de dados no notebook. Em seguida, você limpará o conjunto de dados com o Pandas, criará um modelo de machine learning com o Scikit-learn e usará o Matplotlib para visualizar a saída do modelo.

Objetivos de aprendizagem

Neste módulo, você vai:

  • Criar um Jupyter Notebook em Azure Notebooks, importar dados e exibir os dados carregados no notebook.
  • Usar o Pandas para limpar e preparar dados para serem usados pelo modelo de machine learning.
  • Usar o Scikit-learn para criar o modelo de machine learning.
  • Usar o Matplotlib para visualizar o desempenho do modelo.