Partilhar via


Tutorial do Python: Preveja o aluguel de esqui com regressão linear com aprendizado de máquina SQL

Aplica-se a: SQL Server 2017 (14.x) e versões posteriores Instância Gerenciada SQL do Azure

Nesta série de tutoriais de quatro partes, você usará Python e regressão linear no SQL Server Machine Learning Services ou em clusters de Big Data do SQL Server 2019 para prever o número de aluguéis de esqui. O tutorial usa um bloco de anotações Python no Azure Data Studio.

Nesta série de tutoriais de quatro partes, você usará Python e regressão linear no SQL Server Machine Learning Services para prever o número de aluguéis de esqui. O tutorial usa um bloco de anotações Python no Azure Data Studio.

Nesta série de tutoriais de quatro partes, você usará Python e regressão linear nos Serviços de Aprendizado de Máquina de Instância Gerenciada SQL do Azure para prever o número de aluguéis de esqui. O tutorial usa um bloco de anotações Python no Azure Data Studio.

Imagine que você possui um negócio de aluguel de esqui e quer prever o número de aluguéis que você terá em uma data futura. Estas informações ajudam-no a preparar o seu stock, pessoal e instalações.

Na primeira parte desta série, você será configurado com os pré-requisitos. Nas partes dois e três, você desenvolverá alguns scripts Python em um caderno para preparar seus dados e treinar um modelo de aprendizado de máquina. Em seguida, na parte três, você executará esses scripts Python dentro do banco de dados usando procedimentos armazenados T-SQL.

Neste artigo, você aprenderá a:

  • Importar um banco de dados de exemplo

Na segunda parte, você aprenderá como carregar os dados de um banco de dados em um quadro de dados Python e preparar os dados em Python.

Na terceira parte, você aprenderá como treinar um modelo de regressão linear em Python.

Na quarta parte, você aprenderá como armazenar o modelo em um banco de dados e, em seguida, criar procedimentos armazenados a partir dos scripts Python desenvolvidos nas partes dois e três. Os procedimentos armazenados serão executados no servidor para fazer previsões com base em novos dados.

Pré-requisitos

  • Python IDE - Este tutorial usa um bloco de anotações Python no Azure Data Studio. Para obter mais informações, consulte Como usar blocos de anotações no Azure Data Studio.

  • Ferramenta de consulta SQL - Este tutorial pressupõe que você esteja usando o Azure Data Studio.

  • Pacotes Python adicionais - Os exemplos nesta série de tutoriais usam os seguintes pacotes Python que podem não ser instalados por padrão:

    • pandas
    • pyodbc
    • scikit-learn (biblioteca de aprendizado de máquina em Python)

    Para instalar estes pacotes:

    1. No seu bloco de anotações do Azure Data Studio, selecione Gerenciar Pacotes.
    2. No painel Gerenciar pacotes , selecione a guia Adicionar novo .
    3. Para cada um dos seguintes pacotes, insira o nome do pacote, selecione Pesquisar e, em seguida, selecione Instalar.

    Como alternativa, você pode abrir um Prompt de Comando, alterar para o caminho de instalação da versão do Python que você usa no Azure Data Studio (por exemplo, cd %LocalAppData%\Programs\Python\Python37-32) e executar pip install para cada pacote.

Restaurar o banco de dados de exemplo

O banco de dados de exemplo usado neste tutorial foi salvo em um .bak arquivo de backup de banco de dados para você baixar e usar.

Observação

Se você estiver usando os Serviços de Aprendizado de Máquina em Clusters de Big Data do SQL Server 2019, veja como Restaurar um banco de dados na instância mestre do cluster de big data.

  1. Transfira o ficheiro TutorialDB.bak.

  2. Siga as instruções em Restaurar um banco de dados a partir de um arquivo de backup no Azure Data Studio, usando estes detalhes:

    • Importe do ficheiro TutorialDB.bak que você baixou.
    • Nomeie o banco de dados de destino TutorialDB.
  3. Você pode verificar se o banco de dados restaurado existe consultando a dbo.rental_data tabela:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. Transfira o ficheiro TutorialDB.bak.

  2. Siga as instruções em Restaurar um banco de dados para a Instância Gerenciada SQL do Azure no SQL Server Management Studio, usando estes detalhes:

    • Importe do ficheiro TutorialDB.bak que você baixou.
    • Nomeie o banco de dados de destino TutorialDB.
  3. Você pode verificar se o banco de dados restaurado existe consultando a dbo.rental_data tabela:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

Limpeza de recursos

Se você não quiser continuar com este tutorial, exclua o TutorialDB banco de dados.

Próximo passo

Na primeira parte desta série de tutoriais, você concluiu estas etapas:

  • Instalados os pré-requisitos
  • Importar um banco de dados de exemplo

Para preparar os dados do banco de dados TutorialDB, siga a segunda parte desta série de tutoriais: