Introdução
O Python é uma das linguagens de programação mais populares do mundo. É muito utilizado na comunidade da ciência de dados para machine learning e análise estatística. Um dos motivos pelos quais é tão popular é a disponibilidade de milhares de bibliotecas open source como NumPy, Pandas, Matplotlib e Scikit-learn, que permitem tanto aos programadores como aos investigadores explorarem, transformarem, analisarem e visualizarem dados.
O Azure Notebooks é uma plataforma com base na cloud para criar e executar blocos de notas do Jupyter. O Jupyter é um ambiente com base no IPython que facilita a programação interativa e a análise de dados através da utilização do Python e de outras linguagens de programação. O Azure Notebooks disponibiliza o Jupyter como um serviço gratuito. É uma forma prática de escrever código Python sem ter de instalar e gerir um servidor Jupyter. Como é baseado na Web, é a solução ideal para colaborações online.
Neste módulo, irá criar um bloco de notas do Azure, importar um conjunto de dados que contém informações de chegada à hora prevista de uma grande companhia aérea dos Estados Unidos e carregar o conjunto de dados para o bloco de notas. Em seguida, irá limpar o conjunto de dados com o Pandas, criar um modelo de machine learning com o Scikit-learn e utilizar o Matplotlib para visualizar o resultado do modelo.
Objetivos de Aprendizagem
Neste módulo, irá:
- Criar um bloco de notas do Jupyter no Azure Notebooks, importar dados e visualizar os dados carregados para o bloco de notas.
- Utilizar o Pandas para limpar e preparar os dados a serem utilizados no modelo de machine learning.
- Utilizar o Scikit-learn para criar o modelo de machine learning.
- Utilizar o Matplotlib para visualizar o desempenho do modelo.