チュートリアル:SQL 機械学習を使用して R で予測モデルを開発する

適用対象: SQL Server 2016 (13.x) 以降 Azure SQL Managed Instance

この 4 部構成のチュートリアル シリーズでは、SQL Server Machine Learning Services またはビッグ データ クラスターで R と機械学習モデルを使用して、スキーのレンタル数を予測します。

この 4 部構成のチュートリアル シリーズでは、SQL Server Machine Learning Services で R と機械学習モデルを使用して、スキーのレンタル数を予測します。

この 4 部構成のチュートリアル シリーズでは、SQL Server R Services で R と機械学習モデルを使用して、スキーのレンタル数を予測します。

この 4 部構成のチュートリアル シリーズでは、Azure SQL Managed Instance の Machine Learning Services で R と機械学習モデルを使用して、スキーのレンタル数を予測します。

たとえば、スキー レンタル事業を所有していて、将来の日付に対するレンタル数を予測したい場合を考えてみましょう。 この情報は、在庫、スタッフおよび設備の準備に役立ちます。

このシリーズのパート 1 では、前提条件を設定します。 パート 2 と 3 では、ノートブックでいくつかの R スクリプトを開発して、データを準備し、機械学習モデルをトレーニングします。 その後、パート 3 では、T-SQL ストアド プロシージャを使用してデータベース内でそれらの R スクリプトを実行します。

この記事では、次の方法について学習します。

  • サンプル データベースを復元する

パート 2 では、データベースから Python データ フレームにデータを読み込み、R でデータを準備する方法を学習します。

パート 3 では、R で機械学習モデルをトレーニングする方法について学習します。

パート 4 では、モデルをデータベースに格納した後、パート 2 と 3 で開発した R スクリプトからストアド プロシージャを作成する方法について学習します。 ストアド プロシージャは、新しいデータに基づいて予測を行うためにサーバーで実行されます。

前提条件

  • SQL Server Machine Learning Services - Machine Learning Services をインストールするには、Windows インストール ガイドに関するページを参照してください。
  • R IDE - このチュートリアルでは RStudio Desktop を使用します。

  • RODBC - このドライバーは、このチュートリアルで開発する R スクリプトで使用します。 まだインストールされていない場合は、R コマンド install.packages("RODBC") を使用してインストールします。 RODBC の詳細については、「CRAN-Package RODBC」を参照してください。

  • SQL クエリ ツール - このチュートリアルでは、Azure Data Studio を使用していることを前提としています。 詳細については、「Azure Data Studio でノートブックを使用する方法」を参照してください。

サンプル データベースを復元する

このチュートリアルで使用するサンプル データベースは、ダウンロードして使用できるように .bak データベース バックアップ ファイルに保存されています。

Note

ビッグ データ クラスターで Machine Learning Services を使用している場合は、SQL Server ビッグ データ クラスターのマスター インスタンスにデータベースを復元する方法に関する記事を参照してください。

  1. ファイル TutorialDB.bak をダウンロードします。

  2. Azure Data Studio で、以下の詳細情報を使用して、「バックアップ ファイルからデータベースを復元する」に記載されている手順に従います。

    • ダウンロードした TutorialDB.bak ファイルからインポートします
    • ターゲット データベースに "TutorialDB" という名前を指定します
  3. dbo.rental_data テーブルに対してクエリを実行して、復元されたデータベースが存在することを確認できます。

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    
  1. ファイル TutorialDB.bak をダウンロードします。

  2. 次の詳細を使用して、SQL Server Management Studio で Managed Instance へのデータベースの復元の指示に従います。

    • ダウンロードした TutorialDB.bak ファイルからインポートします
    • ターゲット データベースに "TutorialDB" という名前を指定します
  3. dbo.rental_data テーブルに対してクエリを実行して、復元されたデータベースが存在することを確認できます。

    USE TutorialDB;
    SELECT * FROM [dbo].[rental_data];
    

リソースをクリーンアップする

このチュートリアルを続行しない場合は、TutorialDB データベースを削除してください。

次のステップ

このチュートリアル シリーズの第 1 部では、これらの手順を完了しました。

  • 必須コンポーネントのインストール
  • サンプル データベースの復元

機械学習モデル用にデータを準備するには、このチュートリアル シリーズの第 2 部の手順を実行します。