Megosztás a következőn keresztül:


Python-oktatóanyag: Lineáris regressziós modell üzembe helyezése SQL machine learning használatával

A következőkre vonatkozik: Sql Server 2017 (14.x) és újabb verziók Felügyelt Azure SQL-példány

A négyrészes oktatási anyag sorozat negyedik részében egy lineáris regressziós modellt, amelyet Pythonban fejlesztettek ki, fog telepíteni egy SQL Server-adatbázisba, a Machine Learning Services vagy a Big Data Clusters használatával.

A négyrészes oktatóanyag-sorozat negyedik részében egy Pythonban kifejlesztett lineáris regressziós modellt fog üzembe helyezni egy SQL Server-adatbázisba a Machine Learning Services használatával.

A négyrészes oktatóanyag-sorozat negyedik részében egy Pythonban kifejlesztett lineáris regressziós modellt fog üzembe helyezni egy Felügyelt Azure SQL-példány adatbázisában a Machine Learning Services használatával.

Ebben a cikkben megtudhatja, hogyan:

  • A gépi tanulási modellt létrehozó tárolt eljárás létrehozása
  • A modell tárolása adatbázistáblában
  • Tárolt eljárás létrehozása, amely előrejelzéseket készít a modell használatával
  • A modell végrehajtása új adatokkal

Az első részben megtanulta, hogyan állíthatja vissza a mintaadatbázist.

A második részben megtanulta, hogyan töltheti be az adatokat egy adatbázisból egy Python-adatkeretbe, és hogyan készítheti elő az adatokat a Pythonban.

A harmadik részben megtanulta, hogyan taníthat be lineáris regressziós gépi tanulási modellt a Pythonban.

Előfeltételek

  • Az oktatóanyag negyedik része feltételezi, hogy elvégezte az első részt és annak előfeltételeit.

A modellt létrehozó tárolt eljárás létrehozása

Most a kifejlesztett Python-szkriptek használatával hozzon létre egy tárolt eljárást generate_rental_py_model , amely betanít és létrehozza a lineáris regressziós modellt a LinearRegression használatával a scikit-learnből.

Futtassa a következő T-SQL-utasítást az Azure Data Studióban a modell betanításához szükséges tárolt eljárás létrehozásához.

-- Stored procedure that trains and generates a Python model using the rental_data and a linear regression algorithm
DROP PROCEDURE IF EXISTS generate_rental_py_model;
go
CREATE PROCEDURE generate_rental_py_model (@trained_model varbinary(max) OUTPUT)
AS
BEGIN
    EXECUTE sp_execute_external_script
      @language = N'Python'
    , @script = N'
from sklearn.linear_model import LinearRegression
import pickle

df = rental_train_data

# Get all the columns from the dataframe.
columns = df.columns.tolist()

# Store the variable well be predicting on.
target = "RentalCount"

# Initialize the model class.
lin_model = LinearRegression()

# Fit the model to the training data.
lin_model.fit(df[columns], df[target])

# Before saving the model to the DB table, convert it to a binary object
trained_model = pickle.dumps(lin_model)'

, @input_data_1 = N'select "RentalCount", "Year", "Month", "Day", "WeekDay", "Snow", "Holiday" from dbo.rental_data where Year < 2015'
, @input_data_1_name = N'rental_train_data'
, @params = N'@trained_model varbinary(max) OUTPUT'
, @trained_model = @trained_model OUTPUT;
END;
GO

A modell tárolása adatbázistáblában

Hozzon létre egy táblát a TutorialDB-adatbázisban, majd mentse a modellt a táblába.

  1. Futtassa a következő T-SQL-utasítást az Azure Data Studióban a modell tárolására használt dbo.rental_py_models nevű tábla létrehozásához.

    USE TutorialDB;
    DROP TABLE IF EXISTS dbo.rental_py_models;
    GO
    CREATE TABLE dbo.rental_py_models (
        model_name VARCHAR(30) NOT NULL DEFAULT('default model') PRIMARY KEY,
        model VARBINARY(MAX) NOT NULL
    );
    GO
    
  2. Mentse a modellt bináris objektumként a táblába a modell nevével linear_model.

    DECLARE @model VARBINARY(MAX);
    EXECUTE generate_rental_py_model @model OUTPUT;
    
    INSERT INTO rental_py_models (model_name, model) VALUES('linear_model', @model);
    

Tárolt eljárás létrehozása, amely előrejelzéseket készít

  1. Hozzon létre egy tárolt eljárást py_predict_rentalcount , amely előrejelzéseket készít a betanított modell és egy új adatkészlet használatával. Futtassa le az alább látható T-SQL parancsot az Azure Data Studio programban.

    DROP PROCEDURE IF EXISTS py_predict_rentalcount;
    GO
    CREATE PROCEDURE py_predict_rentalcount (@model varchar(100))
    AS
    BEGIN
        DECLARE @py_model varbinary(max) = (select model from rental_py_models where model_name = @model);
    
        EXECUTE sp_execute_external_script
                    @language = N'Python',
                    @script = N'
    
    # Import the scikit-learn function to compute error.
    from sklearn.metrics import mean_squared_error
    import pickle
    import pandas
    
    rental_model = pickle.loads(py_model)
    
    df = rental_score_data
    
    # Get all the columns from the dataframe.
    columns = df.columns.tolist()
    
    # Variable you will be predicting on.
    target = "RentalCount"
    
    # Generate the predictions for the test set.
    lin_predictions = rental_model.predict(df[columns])
    print(lin_predictions)
    
    # Compute error between the test predictions and the actual values.
    lin_mse = mean_squared_error(lin_predictions, df[target])
    #print(lin_mse)
    
    predictions_df = pandas.DataFrame(lin_predictions)
    
    OutputDataSet = pandas.concat([predictions_df, df["RentalCount"], df["Month"], df["Day"], df["WeekDay"], df["Snow"], df["Holiday"], df["Year"]], axis=1)
    '
    , @input_data_1 = N'Select "RentalCount", "Year" ,"Month", "Day", "WeekDay", "Snow", "Holiday"  from rental_data where Year = 2015'
    , @input_data_1_name = N'rental_score_data'
    , @params = N'@py_model varbinary(max)'
    , @py_model = @py_model
    with result sets (("RentalCount_Predicted" float, "RentalCount" float, "Month" float,"Day" float,"WeekDay" float,"Snow" float,"Holiday" float, "Year" float));
    
    END;
    GO
    
  2. Hozzon létre egy táblát az előrejelzések tárolásához.

    DROP TABLE IF EXISTS [dbo].[py_rental_predictions];
    GO
    
    CREATE TABLE [dbo].[py_rental_predictions](
     [RentalCount_Predicted] [int] NULL,
     [RentalCount_Actual] [int] NULL,
     [Month] [int] NULL,
     [Day] [int] NULL,
     [WeekDay] [int] NULL,
     [Snow] [int] NULL,
     [Holiday] [int] NULL,
     [Year] [int] NULL
    ) ON [PRIMARY]
    GO
    
  3. Végezze el a tárolt eljárást a bérlések számának előrejelzéséhez

    --Insert the results of the predictions for test set into a table
    INSERT INTO py_rental_predictions
    EXEC py_predict_rentalcount 'linear_model';
    
    -- Select contents of the table
    SELECT * FROM py_rental_predictions;
    

    Az alábbihoz hasonló eredményeket kell látnia.

    Tárolt eljárás előrejelzési eredményei

Sikeresen létrehozott, betanított és üzembe helyezett egy modellt. Ezután ezt a modellt egy tárolt eljárásban használta az új adatokon alapuló értékek előrejelzésére.

Következő lépések

Az oktatóanyag-sorozat negyedik részében az alábbi lépéseket hajtotta végre:

  • A gépi tanulási modellt létrehozó tárolt eljárás létrehozása
  • A modell tárolása adatbázistáblában
  • Tárolt eljárás létrehozása, amely előrejelzéseket készít a modell használatával
  • A modell végrehajtása új adatokkal

Ha többet szeretne megtudni a Python sql-alapú gépi tanulással való használatáról, tekintse meg a következőket: