Tutorial do Python: Prever o aluguel de esquis com regressão linear com aprendizado de máquina do SQL
Aplica-se a: SQL Server 2017 (14.x) e versões posteriores Instância Gerenciada de SQL do Azure
Nesta série de tutoriais de quatro partes, você usará a regressão linear e o Python nos Serviços de Machine Learning do SQL Server ou nos Clusters de Big Data do SQL Server 2019 para prever o número de aluguéis de esqui. O tutorial usa um notebook do Python no Azure Data Studio.
Nesta séries de tutoriais de quatro partes, você usará a regressão linear e o Python nos Serviços de Machine Learning do SQL Server para prever o número de locações de esqui. O tutorial usa um notebook do Python no Azure Data Studio.
Nesta séries de tutoriais de quatro partes, você usará a regressão linear e o Python nos Serviços de Machine Learning da Instância Gerenciada de SQL do Azure para prever o número de locações de esqui. O tutorial usa um notebook do Python no Azure Data Studio.
Imagine que você é proprietário de uma empresa de aluguel de esquis e deseja realizar a previsão do número de aluguéis que terá em uma data futura. Essas informações ajudam você a preparar seu estoque, sua equipe e suas instalações.
Na primeira parte desta série, você se preparará com os pré-requisitos. Nas partes dois e três, você desenvolverá alguns scripts do Python em um notebook para preparar seus dados e treinar um modelo de machine learning. Em seguida, na parte três, você executará esses scripts Python dentro do banco de dados usando procedimentos armazenados de T-SQL.
Neste artigo, você aprenderá a:
- Importar um banco de dados de exemplo
Na parte dois, você aprenderá a carregar os dados de um banco de dados em uma estrutura do Python e a prepará-los no Python.
Na parte três, você aprenderá a treinar um modelo de regressão linear no Python.
Na parte quatro, você aprenderá a armazenar o modelo em um banco de dados e, em seguida, criará procedimentos armazenados com base nos scripts do Python desenvolvidos nas partes dois e três. Os procedimentos armazenados serão executados no servidor para fazer previsões com base em novos dados.
Pré-requisitos
- Serviços do Machine Learning do SQL Server: para instalar os Serviços do Machine Learning, confira o guia de instalação para o Windows ou o guia de instalação para o Linux. Você também pode habilitar Serviços de Machine Learning em Clusters de Big Data do SQL Server 2019.
- Serviços do Machine Learning do SQL Server: para instalar os Serviços do Machine Learning, confira o guia de instalação para o Windows.
Serviços do Machine Learning da Instância Gerenciada de SQL do Azure: para obter informações, confira a visão geral dos Serviços do Machine Learning da Instância Gerenciada de SQL do Azure.
SQL Server Management Studio (SSMS): use o SSMS para restaurar o banco de dados de amostra para a Instância Gerenciada de SQL do Azure. Para efetuar o download, confira SQL Server Management Studio.
IDE para Python: este tutorial usa um notebook Python no Azure Data Studio. Para obter mais informações, confira Como usar notebooks no Azure Data Studio.
Ferramenta de consulta SQL: este tutorial pressupõe que você esteja usando o Azure Data Studio.
Pacotes adicionais para Python: os exemplos nesta série de tutoriais usam os seguintes pacotes para Python que podem não ser instalados por padrão:
- pandas
- pyodbc
- scikit-learn
Para instalar esses pacotes:
- No notebook do Azure Data Studio, selecione Gerenciar Pacotes.
- No painel Gerenciar Pacotes, selecione a guia Adicionar Novo.
- Para cada pacote a seguir, insira o nome do pacote, selecione Pesquisar e Instalar.
Como alternativa, você pode abrir um Prompt de Comando, alterar para o caminho de instalação da versão do Python usada no Azure Data Studio (por exemplo,
cd %LocalAppData%\Programs\Python\Python37-32
) e executarpip install
para cada pacote.
Restaurar o banco de dados de exemplo
O banco de dados de amostra usado neste tutorial foi salvo em um arquivo de backup do banco de dados .bak
para você efetuar o download e usar.
Observação
Se você estiver usando Serviços de Machine Learning em Clusters de Big Data do SQL Server 2019, confira como Restaurar um banco de dados na instância mestra de cluster de big data.
Baixe o arquivo TutorialDB.bak.
Siga as instruções em Restaurar um banco de dados de um arquivo de backup no Azure Data Studio, usando estes detalhes:
- Importe do arquivo
TutorialDB.bak
que você baixou. - Nomeie o banco de dados de destino
TutorialDB
.
- Importe do arquivo
É possível verificar se o banco de dados restaurado existe consultando a tabela
dbo.rental_data
:USE TutorialDB; SELECT * FROM [dbo].[rental_data];
Baixe o arquivo TutorialDB.bak.
Siga as instruções descritas em Restaurar um banco de dados em uma Instância Gerenciada de SQL do Azure no SQL Server Management Studio usando estes detalhes:
- Importe do arquivo
TutorialDB.bak
que você baixou. - Nomeie o banco de dados de destino
TutorialDB
.
- Importe do arquivo
É possível verificar se o banco de dados restaurado existe consultando a tabela
dbo.rental_data
:USE TutorialDB; SELECT * FROM [dbo].[rental_data];
Limpar os recursos
Se você não continuar com este tutorial, exclua o banco de dados TutorialDB
.
Próxima etapa
Na parte um desta série de tutoriais, você concluiu estas etapas:
- Instalar os pré-requisitos
- Importar um banco de dados de exemplo
Para preparar os dados do banco de dados TutorialDB, siga a parte dois desta série de tutoriais: