Comparteix a través de


Tutorial: Desarrollo de un modelo predictivo en R con el aprendizaje automático de SQL

Se aplica a: SQL Server 2016 (13.x) y versiones posteriores Azure SQL Managed Instance

En esta serie de tutoriales de cuatro partes, usarás R y un modelo de Machine Learning en SQL Server Machine Learning Services o en clústeres de macrodatos para predecir el número de alquileres de esquíes.

En esta serie de tutoriales de cuatro partes, usarás R y un modelo de Machine Learning en SQL Server Machine Learning Services para predecir el número de alquileres de esquíes.

En esta serie de tutoriales de cuatro partes, usarás R y un modelo de Machine Learning en SQL Server R Services para predecir el número de alquileres de esquíes.

En esta serie de tutoriales de cuatro partes, usarás R y un modelo de Machine Learning en Machine Learning Services en Azure SQL Managed Instance para predecir el número de alquileres de esquíes.

Imagine que es el propietario de una empresa de alquiler de esquíes y quiere predecir el número de alquileres que tendrá en una fecha futura. Esta información le ayudará a preparar las existencias, el personal y las instalaciones.

En la primera parte de esta serie, configurará los requisitos previos. En las partes dos y tres, desarrollará scripts de R en un cuaderno para preparar sus datos y entrenar un modelo de Machine Learning. Luego, en la tercera parte, ejecutará esos scripts de R en una base de datos mediante procedimientos almacenados de T-SQL.

En este artículo, aprenderá a:

  • Restauración de una base de datos de ejemplo

En la parte dos, aprenderá a cargar los datos desde una base de datos en una trama de datos de Python y a preparar los datos en R.

En la parte tres, aprenderá a entrenar un modelo de Machine Learning en R.

En la parte cuatro, aprenderá a almacenar el modelo en una base de datos y, luego, a crear procedimientos almacenados a partir de los scripts de R desarrollados en las partes dos y tres. Los procedimientos almacenados se ejecutarán en el servidor para realizar predicciones basándose en datos nuevos.

Requisitos previos

  • IDE de R: en este tutorial se usa RStudio Desktop.

  • RODBC: este controlador se usa en los scripts de R que vas a desarrollar en este tutorial. Si aún no está instalado, instálelo con el comando install.packages("RODBC") de R. Para obtener más información sobre RODBC, vea CRAN: paquete RODBC.

  • Herramienta de consultas SQL: en este tutorial, se da por hecho que usa Azure Data Studio. Para más información, vea Uso de cuadernos en Azure Data Studio.

Restauración de la base de datos de ejemplo

La base de datos de ejemplo usada en este tutorial se ha guardado en un archivo de copia de seguridad de base de datos .bak para que puedas descargarlo y usarlo.

Nota:

Si usa Machine Learning Services en clústeres de macrodatos, consulte Restauración de una base de datos en la instancia maestra del clúster de macrodatos de SQL Server.

  1. Descargue el archivo TutorialDB.bak.

  2. Siga las indicaciones de Restauración de una base de datos a partir de un archivo de copia de seguridad en Azure Data Studio con estos datos:

    • Importe el archivo TutorialDB.bak que ha descargado.
    • Asigne el nombre TutorialDB a la base de datos de destino.
  3. Para comprobar que la base de datos restaurada existe, consulte la tabla dbo.rental_data:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. Descargue el archivo TutorialDB.bak.

  2. Siga las instrucciones de Restauración de una base de datos en Azure SQL Managed Instance en SQL Server Management Studio, con los detalles siguientes:

    • Importe el archivo TutorialDB.bak que ha descargado.
    • Asigne el nombre TutorialDB a la base de datos de destino.
  3. Para comprobar que la base de datos restaurada existe, consulte la tabla dbo.rental_data:

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

Limpieza de recursos

Si no quiere continuar con este tutorial, elimine la base de datos TutorialDB.

Paso siguiente

En la parte uno de esta serie de tutoriales, ha completado estos pasos:

  • Instalación de los requisitos previos
  • Restauración de una base de datos de ejemplo

Para preparar los datos para el modelo de aprendizaje automático, siga la parte dos de esta serie de tutoriales: