このレッスンでは、履歴データに基づいて時間の経過と同時に値を予測できるマイニング モデルを作成します。 モデルを作成すると、基になる構造が自動的に生成され、追加のマイニング モデルの基礎として使用できます。
このレッスンでは、予測モデルと Microsoft Time Series アルゴリズムの要件に精通していることを前提としています。 詳細については、「 Microsoft Time Series Algorithm」を参照してください。
CREATE MINING MODEL ステートメント
マイニング モデルを直接作成し、基になるマイニング構造を自動的に生成するには、 CREATE MINING MODEL (DMX) ステートメントを使用します。 ステートメント内のコードは、次の部分に分割できます。
モデルの名前付け
タイム スタンプの定義
オプションの系列キー列の定義
予測可能な属性または属性の定義
CREATE MINING MODEL ステートメントの一般的な例を次に示します。
CREATE MINING MODEL [<Mining Structure Name>]
(
<key columns>,
<predictable attribute columns>
)
USING <algorithm name>([parameter list])
WITH DRILLTHROUGH
コードの最初の行では、マイニング モデルの名前を定義します。
CREATE MINING MODEL [Mining Model Name]
Analysis Services では、モデル名に "_structure" を追加することで、基になる構造体の名前が自動的に生成されます。これにより、構造名がモデル名から一意であることが保証されます。 DMX でのオブジェクトの名前付けの詳細については、「 識別子 (DMX)」を参照してください。
コードの次の行では、マイニング モデルのキー列を定義します。タイム シリーズ モデルの場合は、ソース データ内の時間ステップを一意に識別します。 時間ステップは、列名とデータ型の後に KEY TIME キーワードで識別されます。 時系列モデルに個別の系列キーがある場合は、 KEY キーワードを使用して識別されます。
<key columns>
コードの次の行は、予測されるモデル内の列を定義するために使用されます。 1 つのマイニング モデルに複数の予測可能な属性を含めることができます。 予測可能な属性が複数ある場合、Microsoft Time Series アルゴリズムでは、系列ごとに個別の分析が生成されます。
<predictable attribute columns>
このレッスンの作業
このレッスンでは、次のタスクを実行します。
新しい空のクエリを作成する
クエリを変更してマイニング モデルを作成する
クエリを実行します
クエリの作成
最初の手順では、Analysis Services のインスタンスに接続し、SQL Server Management Studio で新しい DMX クエリを作成します。
SQL Server Management Studio で新しい DMX クエリを作成するには
SQL Server Management Studio を開きます。
[ サーバーへの接続 ] ダイアログ ボックスの [ サーバーの種類] で、[ Analysis Services] を選択します。 [ サーバー名] に、
LocalHost、またはこのレッスンで接続する Analysis Services のインスタンスの名前を入力します。 [接続] をクリックします。オブジェクト エクスプローラーで、Analysis Services のインスタンスを右クリックし、[新しいクエリ] をポイントして、[DMX] をクリックします。
クエリ エディターが開き、新しい空のクエリが含まれています。
クエリの変更
次の手順では、CREATE MINING MODEL ステートメントを変更して、基になるマイニング構造と共に予測に使用されるマイニング モデルを作成します。
CREATE MINING MODEL ステートメントをカスタマイズするには
クエリ エディターで、CREATE MINING MODEL ステートメントの一般的な例を空白のクエリにコピーします。
次のコードを置き換えます。
[mining model name]次の内容に置き換えます。
[Forecasting_MIXED]次のコードを置き換えます。
<key columns>次の内容に置き換えます。
[Reporting Date] DATE KEY TIME, [Model Region] TEXT KEYTIME KEYキーワードは、ReportingDate 列に値の順序付けに使用される時間ステップ値が含まれていることを示します。 値が一意でデータが並べ替えられている限り、時間ステップには日付と時刻、整数、または順序付けられたデータ型を指定できます。TEXTキーワードとKEYキーワードは、ModelRegion 列に追加の系列キーが含まれていることを示します。 系列キーは 1 つだけ使用でき、列の値は個別である必要があります。次のコードを置き換えます。
< predictable attribute columns> )次の内容に置き換えます。
[Quantity] LONG CONTINUOUS PREDICT, [Amount] DOUBLE CONTINUOUS PREDICT )次のコードを置き換えます。
USING <algorithm name>([parameter list]) WITH DRILLTHROUGH次の内容に置き換えます。
USING Microsoft_Time_Series(AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED') WITH DRILLTHROUGHアルゴリズム パラメーター
AUTO_DETECT_PERIODICITY= 0.8 は、アルゴリズムでデータ内のサイクルを検出することを示します。 この値を 1 に近い値に設定すると、多くのパターンの検出が優先されますが、処理が遅くなる可能性があります。アルゴリズム パラメーター
FORECAST_METHODは、ARTXP、ARIMA、またはその両方を使用してデータを分析するかどうかを示します。キーワード
WITH DRILLTHROUGH、モデルの完了後にソース データの詳細な統計情報を表示できるように指定します。 Microsoft タイム シリーズ ビューアーを使用してモデルを参照する場合は、この句を追加する必要があります。 予測には必要ありません。これで、完全なステートメントは次のようになります。
CREATE MINING MODEL [Forecasting_MIXED] ( [Reporting Date] DATE KEY TIME, [Model Region] TEXT KEY, [Quantity] LONG CONTINUOUS PREDICT, [Amount] DOUBLE CONTINUOUS PREDICT ) USING Microsoft_Time_Series (AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED') WITH DRILLTHROUGH[ ファイル ] メニューの [ DMXQuery1.dmx As の保存] をクリックします。
[ 名前を付けて保存 ] ダイアログ ボックスで、適切なフォルダーを参照し、ファイルに
Forecasting_MIXED.dmx名前を付けます。
クエリの実行
最後の手順では、クエリを実行します。 クエリを作成して保存したら、サーバー上にマイニング モデルとそのマイニング構造を作成するために実行する必要があります。 クエリ エディターでのクエリの実行の詳細については、「 データベース エンジン クエリ エディター (SQL Server Management Studio)」を参照してください。
クエリを実行するには
クエリ エディターのツール バーの [ 実行] をクリックします。
ステートメントの実行が完了すると、クエリ エディターの下部にある [ メッセージ ] タブにクエリの状態が表示されます。 メッセージが表示されます。
Executing the query Execution completeForecasting_MIXED_Structureという名前の新しい構造が、関連するマイニング モデル Forecasting_MIXEDと共にサーバー上に存在するようになりました。
次のレッスンでは、先ほど作成した Forecasting_MIXED マイニング構造にマイニング モデルを追加します。
次のレッスン
レッスン 2: 時系列マイニング構造へのマイニング モデルの追加
こちらもご覧ください
時系列モデルのマイニング モデル コンテンツ (Analysis Services - データ マイニング)
Microsoft タイム シリーズ アルゴリズム技術リファレンス