Python のチュートリアル:SQL 機械学習での線形回帰を使用したスキー レンタルの予測
適用対象: SQL Server 2017 (14.x) 以降 Azure SQL Managed Instance
この 4 部構成のチュートリアル シリーズでは、SQL Server Machine Learning Services または SQL Server 2019 ビッグ データ クラスターで Python と線形回帰を使用して、スキーのレンタル数を予測します。 このチュートリアルは、Azure Data Studio で Python のノートブックを使用します。
この 4 部構成のチュートリアル シリーズでは、SQL Server Machine Learning Services で Python と線形回帰を使用して、スキーのレンタル数を予測します。 このチュートリアルは、Azure Data Studio で Python のノートブックを使用します。
この 4 部構成のチュートリアル シリーズでは、Azure SQL Managed Instance Machine Learning Services で Python と線形回帰を使用して、スキーのレンタル数を予測します。 このチュートリアルは、Azure Data Studio で Python のノートブックを使用します。
たとえば、スキー レンタル事業を所有していて、将来のレンタル数を予測したい場合を考えてみましょう。 この情報は、在庫、スタッフおよび設備の準備に役立ちます。
このシリーズのパート 1 では、前提条件を設定します。 パート 2 と 3 では、ノートブックでいくつかの Python スクリプトを開発して、データを準備し、機械学習モデルをトレーニングします。 次にパート 3 では、T-SQL ストアド プロシージャを使用して、データベース内でこれらの Python スクリプトを実行します。
この記事では、次の方法について学習します。
- サンプル データベースのインポート
パート 2 では、データベースから Python データ フレームにデータを読み込み、Python でデータを準備する方法を学習します。
パート 3 では、Python で線形回帰モデルをトレーニングする方法について学習します。
パート 4 では、モデルをデータベースに格納した後、パート 2 と 3 で開発した Python スクリプトからストアド プロシージャを作成する方法について学習します。 ストアド プロシージャは、新しいデータに基づいて予測を行うためにサーバーで実行されます。
前提条件
- SQL Server Machine Learning Services - Machine Learning Services をインストールするには、Windows インストール ガイドまたは Linux インストール ガイドに関するページを参照してください。 SQL Server 2019 ビッグ データ クラスターで Machine Learning Services を有効にすることもできます。
- SQL Server Machine Learning Services - Machine Learning Services をインストールするには、Windows インストール ガイドに関するページを参照してください。
Azure SQL Managed Instance Machine Learning Services - 詳細については、Azure SQL Managed Instance の Machine Learning Services の概要に関するページを参照してください。
SQL Server Management Studio (SSMS) - SSMS を使用して、サンプル データベースを Azure SQL Managed Instance に復元します。 ダウンロードするには、SQL Server Management Studio に関するページをを参照してください。
Python IDE - このチュートリアルは、Azure Data Studio で Python のノートブックを使用します。 詳細については、「Azure Data Studio でノートブックを使用する方法」を参照してください。
SQL クエリ ツール - このチュートリアルでは、Azure Data Studio を使用していることを前提としています。
追加の Python パッケージ - このチュートリアル シリーズの例では、既定ではインストールされない可能性がある次の Python パッケージを使用します。
- pandas
- pyodbc
- scikit-learn
これらのパッケージをインストールするには:
- Azure Data Studio ノートブックで、 [パッケージの管理] を選択します。
- [パッケージの管理] ペインで [新規追加] タブを選択します。
- 次の各パッケージについてパッケージ名を入力し、[検索] を選択し、[インストール] を選択します。
また、 [コマンド プロンプト] を開き、Azure Data Studio で使用する Python のバージョンのインストール パス (たとえば
cd %LocalAppData%\Programs\Python\Python37-32
) に変更し、パッケージごとにpip install
を実行する方法もあります。
サンプル データベースを復元する
このチュートリアルで使用するサンプル データベースは、ダウンロードして使用できるように .bak
データベース バックアップ ファイルに保存されています。
Note
SQL Server 2019 ビッグ データ クラスターで Machine Learning Services を使用している場合は、ビッグ データ クラスターのマスター インスタンスにデータベースを復元する方法に関する記事を参照してください。
ファイル TutorialDB.bak をダウンロードします。
Azure Data Studio で、以下の詳細情報を使用して、「バックアップ ファイルからデータベースを復元する」に記載されている手順に従います。
- ダウンロードした
TutorialDB.bak
ファイルからインポートします。 - ターゲット データベースに
TutorialDB
という名前を指定します。
- ダウンロードした
dbo.rental_data
テーブルに対してクエリを実行して、復元されたデータベースが存在することを確認できます。USE TutorialDB; SELECT * FROM [dbo].[rental_data];
ファイル TutorialDB.bak をダウンロードします。
次の詳細を使用して、SQL Server Management Studio で「Azure SQL Managed Instance にデータベースを復元する」の指示に従います。
- ダウンロードした
TutorialDB.bak
ファイルからインポートします。 - ターゲット データベースに
TutorialDB
という名前を指定します。
- ダウンロードした
dbo.rental_data
テーブルに対してクエリを実行して、復元されたデータベースが存在することを確認できます。USE TutorialDB; SELECT * FROM [dbo].[rental_data];
リソースをクリーンアップする
このチュートリアルを続行しない場合は、TutorialDB
データベースを削除してください。
次のステップ
このチュートリアル シリーズの第 1 部では、これらの手順を完了しました。
- 必須コンポーネントのインストール
- サンプル データベースのインポート
TutorialDB データベースからデータを準備するには、このチュートリアル シリーズのパート 2 の手順を実行します。