Tutorial de Python: Predicción de alquileres de esquíes con regresión lineal con aprendizaje automático de SQL

Se aplica a: SQL Server 2017 (14.x) y versiones posteriores Azure SQL Managed Instance

En esta serie de tutoriales de cuatro partes, usará Python y una regresión lineal en SQL Server Machine Learning Services o en clústeres de macrodatos de SQL Server 2019 para predecir el número de alquileres de esquíes. En este tutorial, se usa un cuaderno de Python en Azure Data Studio.

En esta serie de tutoriales de cuatro partes, usará Python y una regresión lineal en SQL Server Machine Learning Services para predecir el número de alquileres de esquíes. En este tutorial, se usa un cuaderno de Python en Azure Data Studio.

En esta serie de tutoriales de cuatro partes, usará Python y una regresión lineal en Machine Learning Services en Azure SQL Managed Instance para predecir el número de alquileres de esquíes. En este tutorial, se usa un cuaderno de Python en Azure Data Studio.

Imagine que es el propietario de una empresa de alquiler de esquíes y quiere predecir el número de alquileres que tendrá en una fecha futura. Esta información le ayudará a preparar las existencias, el personal y las instalaciones.

En la primera parte de esta serie, configurará los requisitos previos. En las partes dos y tres, desarrollará scripts de Python en un cuaderno para preparar sus datos y entrenar un modelo de aprendizaje automático. Después, en la parte tres, ejecutará esos scripts de Python en la base de datos con procedimientos almacenados en T-SQL.

En este artículo, aprenderá a:

  • Importar una base de datos de ejemplo

En la parte dos, aprenderá a cargar los datos desde una base de datos en una trama de datos de Python y a preparar los datos en Python.

En la parte tres, aprenderá a entrenar un modelo de regresión lineal en Python.

En la parte cuatro, aprenderá a almacenar el modelo en una base de datos y, luego, a crear procedimientos almacenados a partir de los scripts de Python desarrollados en las partes dos y tres. Los procedimientos almacenados se ejecutarán en el servidor para realizar predicciones basándose en datos nuevos.

Prerrequisitos

  • IDE de Python: en este tutorial, se usa un cuaderno de Python en Azure Data Studio. Para más información, vea Uso de cuadernos en Azure Data Studio.

  • Herramienta de consultas SQL: en este tutorial, se da por hecho que usa Azure Data Studio.

  • Paquetes de Python adicionales: en los ejemplos de esta serie de tutoriales, se usan los paquetes de Python siguiente que puede que no estén instalados de manera predeterminada:

    • Pandas
    • pyodbc
    • sklearn

    Para instalar estos paquetes:

    1. En el cuaderno de Azure Data Studio, seleccione Administrar paquetes.
    2. En el panel Administrar paquetes, seleccione la pestaña Agregar nuevo.
    3. Para cada uno de los paquetes siguientes, escriba el nombre del paquete, seleccione Buscar y, a continuación, seleccione Instalar.

    Como alternativa, puede abrir un símbolo del sistema, cambiar a la ruta de instalación de la versión de Python que usa en Azure Data Studio (por ejemplo, cd %LocalAppData%\Programs\Python\Python37-32) y, a continuación, ejecutar pip install para cada paquete.

Restauración de la base de datos de ejemplo

La base de datos de ejemplo usada en este tutorial se ha guardado en un archivo de copia de seguridad de base de datos .bak para que pueda descargarlo y usarlo.

Nota

Si usa Machine Learning Services en clústeres de macrodatos de SQL Server 2019, consulte Restauración de una base de datos en la instancia maestra del clúster de macrodatos.

  1. Descargue el archivo TutorialDB.bak.

  2. Siga las indicaciones de Restauración de una base de datos a partir de un archivo de copia de seguridad en Azure Data Studio con estos datos:

    • Importe el archivo TutorialDB.bak que ha descargado.
    • Asigne el nombre TutorialDB a la base de datos de destino.
  3. Para comprobar que la base de datos restaurada existe, consulte la tabla dbo.rental_data:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. Descargue el archivo TutorialDB.bak.

  2. Siga las instrucciones de Restauración de una base de datos en Azure SQL Managed Instance en SQL Server Management Studio, con los detalles siguientes:

    • Importe el archivo TutorialDB.bak que ha descargado.
    • Asigne el nombre TutorialDB a la base de datos de destino.
  3. Para comprobar que la base de datos restaurada existe, consulte la tabla dbo.rental_data:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

Limpieza de recursos

Si no quiere continuar con este tutorial, elimine la base de datos TutorialDB.

Pasos siguientes

En la parte uno de esta serie de tutoriales, ha completado estos pasos:

  • Instalación de los requisitos previos
  • Importar una base de datos de ejemplo

Para preparar los datos de la base de datos TutorialDB, siga la parte dos de esta serie de tutoriales: