Megosztás a következőn keresztül:


Oktatóanyag: Prediktív modell üzembe helyezése az R-ben SQL Machine Learning használatával

A következőkre vonatkozik: Sql Server 2016 (13.x) és újabb verziók felügyelt Azure SQL-példány

A négyrészes oktatóanyag-sorozat negyedik részében egy R-ben fejlesztett gépitanulási modellt fog üzembe helyezni az SQL Server Machine Learning Services (ML Services) rendszerében vagy a Big Data-fürtökön.

A négyrészes oktatóanyag-sorozat negyedik részében egy R-ben fejlesztett gépi tanulási modellt fog üzembe helyezni az SQL Serveren a Machine Learning Services használatával.

A négyrészes oktatóanyag-sorozat negyedik részében egy R-ben fejlesztett gépi tanulási modellt fog üzembe helyezni az SQL Serverben az SQL Server R Services használatával.

A négyrészes oktatóanyag-sorozat negyedik részében egy R-ben kifejlesztett gépi tanulási modellt fog üzembe helyezni az Azure SQL Managed Instance-ben a Machine Learning Services használatával.

Ebben a cikkben megtudhatja, hogyan:

  • A gépi tanulási modellt létrehozó tárolt eljárás létrehozása
  • A modell tárolása adatbázistáblában
  • Tárolt eljárás létrehozása, amely előrejelzéseket készít a modell használatával
  • A modell végrehajtása új adatokkal

Az első részben megtanulta, hogyan állíthatja vissza a mintaadatbázist.

A második részben megtanulta, hogyan importálhat egy mintaadatbázist, majd hogyan készítheti elő a prediktív modell betanításához használandó adatokat az R-ben.

A harmadik részben megtanulta, hogyan hozhat létre és taníthat be több gépi tanulási modellt az R-ben, majd kiválaszthatja a legpontosabbat.

Előfeltételek

Az oktatóanyag negyedik része feltételezi, hogy teljesítette az első rész előfeltételeit, és elvégezte a második és harmadik rész lépéseit.

A modellt létrehozó tárolt eljárás létrehozása

Az oktatóanyag-sorozat harmadik részében úgy döntött, hogy a döntési fa (dtree) modell a legpontosabb. Most a kifejlesztett R-szkriptek használatával hozzon létre egy tárolt eljárást (generate_rental_model), amely betanít és létrehozza a dtree-modellt az R-csomag rpart használatával.

Futtassa az alábbi parancsokat az Azure Data Studióban.

USE [TutorialDB]
DROP PROCEDURE IF EXISTS generate_rental_model;
GO
CREATE PROCEDURE generate_rental_model (@trained_model VARBINARY(max) OUTPUT)
AS
BEGIN
    EXECUTE sp_execute_external_script @language = N'R'
        , @script = N'
rental_train_data$Month   <- factor(rental_train_data$Month);
rental_train_data$Day     <- factor(rental_train_data$Day);
rental_train_data$Holiday <- factor(rental_train_data$Holiday);
rental_train_data$Snow    <- factor(rental_train_data$Snow);
rental_train_data$WeekDay <- factor(rental_train_data$WeekDay);

#Create a dtree model and train it using the training data set
library(rpart);
model_dtree <- rpart(RentalCount ~ Month + Day + WeekDay + Snow + Holiday, data = rental_train_data);
#Serialize the model before saving it to the database table
trained_model <- as.raw(serialize(model_dtree, connection=NULL));
'
        , @input_data_1 = N'
            SELECT RentalCount
                 , Year
                 , Month
                 , Day
                 , WeekDay
                 , Snow
                 , Holiday
            FROM dbo.rental_data
            WHERE Year < 2015
            '
        , @input_data_1_name = N'rental_train_data'
        , @params = N'@trained_model varbinary(max) OUTPUT'
        , @trained_model = @trained_model OUTPUT;
END;
GO

A modell tárolása adatbázistáblában

Hozzon létre egy táblát a TutorialDB-adatbázisban, majd mentse a modellt a táblába.

  1. Hozzon létre egy táblát (rental_models) a modell tárolásához.

    USE TutorialDB;
    DROP TABLE IF EXISTS rental_models;
    GO
    CREATE TABLE rental_models (
          model_name VARCHAR(30) NOT NULL DEFAULT('default model') PRIMARY KEY
        , model VARBINARY(MAX) NOT NULL
        );
    GO
    
  2. Mentse a modellt a táblába bináris objektumként a "DTree" modellnévvel.

    -- Save model to table
    TRUNCATE TABLE rental_models;
    
    DECLARE @model VARBINARY(MAX);
    
    EXECUTE generate_rental_model @model OUTPUT;
    
    INSERT INTO rental_models (
          model_name
        , model
        )
    VALUES (
         'DTree'
        , @model
        );
    
    SELECT *
    FROM rental_models;
    

Tárolt eljárás létrehozása, amely előrejelzéseket készít

Hozzon létre egy tárolt eljárást (predict_rentalcount_new), amely előrejelzéseket készít a betanított modell és egy új adatkészlet használatával.

-- Stored procedure that takes model name and new data as input parameters and predicts the rental count for the new data
USE [TutorialDB]
DROP PROCEDURE IF EXISTS predict_rentalcount_new;
GO
CREATE PROCEDURE predict_rentalcount_new (
      @model_name VARCHAR(100)
    , @input_query NVARCHAR(MAX)
    )
AS
BEGIN
    DECLARE @model VARBINARY(MAX) = (
            SELECT model
            FROM rental_models
            WHERE model_name = @model_name
            );

    EXECUTE sp_execute_external_script @language = N'R'
        , @script = N'
#Convert types to factors
rentals$Month   <- factor(rentals$Month);
rentals$Day     <- factor(rentals$Day);
rentals$Holiday <- factor(rentals$Holiday);
rentals$Snow    <- factor(rentals$Snow);
rentals$WeekDay <- factor(rentals$WeekDay);

#Before using the model to predict, we need to unserialize it
rental_model <- unserialize(model);

#Call prediction function
rental_predictions <- predict(rental_model, rentals);
rental_predictions <- data.frame(rental_predictions);
'
        , @input_data_1 = @input_query
        , @input_data_1_name = N'rentals'
        , @output_data_1_name = N'rental_predictions'
        , @params = N'@model varbinary(max)'
        , @model = @model
    WITH RESULT SETS(("RentalCount_Predicted" FLOAT));
END;
GO

A modell végrehajtása új adatokkal

Most a tárolt eljárással predict_rentalcount_new előrejelezheti a bérlések számát az új adatok alapján.

-- Use the predict_rentalcount_new stored procedure with the model name and a set of features to predict the rental count
EXECUTE dbo.predict_rentalcount_new @model_name = 'DTree'
    , @input_query = '
        SELECT CONVERT(INT,  3) AS Month
             , CONVERT(INT, 24) AS Day
             , CONVERT(INT,  4) AS WeekDay
             , CONVERT(INT,  1) AS Snow
             , CONVERT(INT,  1) AS Holiday
        ';
GO

Az alábbihoz hasonló eredményt kell látnia.

RentalCount_Predicted
332.571428571429

Sikeresen létrehozott, betanított és üzembe helyezett egy modellt egy adatbázisban. Ezután ezt a modellt egy tárolt eljárásban használta az új adatokon alapuló értékek előrejelzésére.

Erőforrások tisztítása

Ha befejezte a TutorialDB-adatbázis használatát, törölje azt a kiszolgálóról.

Következő lépések

Az oktatóanyag-sorozat negyedik részében megtanulta, hogyan:

  • A gépi tanulási modellt létrehozó tárolt eljárás létrehozása
  • A modell tárolása adatbázistáblában
  • Tárolt eljárás létrehozása, amely előrejelzéseket készít a modell használatával
  • A modell végrehajtása új adatokkal

Az R Machine Learning Servicesben való használatáról a következő témakörben olvashat bővebben: