レッスン 1: タイムシリーズマイニングモデルとマイニング構造の作成

このレッスンでは、履歴データに基づいて時間の経過と同時に値を予測できるマイニングモデルを作成します。モデルを作成すると、基になる構造が自動的に生成され、追加のマイニングモデルの基礎として使用できます。

このレッスンでは、予測モデルと Microsoft Time Series アルゴリズムの要件に精通していることを前提としています。詳細については、「 Microsoft Time Series Algorithm」を参照してください。

CREATE MINING MODEL ステートメント

マイニングモデルを直接作成し、基になるマイニング構造を自動的に生成するには、 CREATE MINING MODEL (DMX) ステートメントを使用します。ステートメント内のコードは、次の部分に分割できます。

モデルの名前付け
タイムスタンプの定義
オプションの系列キー列の定義
予測可能な属性または属性の定義

CREATE MINING MODEL ステートメントの一般的な例を次に示します。

CREATE MINING MODEL [<Mining Structure Name>]  
(  
   <key columns>,  
   <predictable attribute columns>  
)  
USING <algorithm name>([parameter list])  
WITH DRILLTHROUGH

コードの最初の行では、マイニングモデルの名前を定義します。

CREATE MINING MODEL [Mining Model Name]

Analysis Services では、モデル名に "_structure" を追加することで、基になる構造体の名前が自動的に生成されます。これにより、構造名がモデル名から一意であることが保証されます。 DMX でのオブジェクトの名前付けの詳細については、「識別子 (DMX)」を参照してください。

コードの次の行では、マイニングモデルのキー列を定義します。タイムシリーズモデルの場合は、ソースデータ内の時間ステップを一意に識別します。時間ステップは、列名とデータ型の後に KEY TIME キーワードで識別されます。時系列モデルに個別の系列キーがある場合は、 KEY キーワードを使用して識別されます。

<key columns>

コードの次の行は、予測されるモデル内の列を定義するために使用されます。 1 つのマイニングモデルに複数の予測可能な属性を含めることができます。予測可能な属性が複数ある場合、Microsoft Time Series アルゴリズムでは、系列ごとに個別の分析が生成されます。

<predictable attribute columns>

このレッスンの作業

このレッスンでは、次のタスクを実行します。

新しい空のクエリを作成する
クエリを変更してマイニングモデルを作成する
クエリを実行します

クエリの作成

最初の手順では、Analysis Services のインスタンスに接続し、SQL Server Management Studio で新しい DMX クエリを作成します。

SQL Server Management Studio で新しい DMX クエリを作成するには

SQL Server Management Studio を開きます。
[ サーバーへの接続 ] ダイアログボックスの [ サーバーの種類] で、[ Analysis Services] を選択します。 [ サーバー名] に、 LocalHost、またはこのレッスンで接続する Analysis Services のインスタンスの名前を入力します。 [接続] をクリックします。
オブジェクトエクスプローラーで、Analysis Services のインスタンスを右クリックし、[新しいクエリ] をポイントして、[DMX] をクリックします。

クエリエディターが開き、新しい空のクエリが含まれています。

クエリの変更

次の手順では、CREATE MINING MODEL ステートメントを変更して、基になるマイニング構造と共に予測に使用されるマイニングモデルを作成します。

CREATE MINING MODEL ステートメントをカスタマイズするには

クエリエディターで、CREATE MINING MODEL ステートメントの一般的な例を空白のクエリにコピーします。
次のコードを置き換えます。
```
[mining model name]   
```
次の内容に置き換えます。
```
[Forecasting_MIXED]  
```
次のコードを置き換えます。
```
<key columns>  
```
次の内容に置き換えます。
```
[Reporting Date] DATE KEY TIME,  
[Model Region] TEXT KEY  
```
TIME KEYキーワードは、ReportingDate 列に値の順序付けに使用される時間ステップ値が含まれていることを示します。値が一意でデータが並べ替えられている限り、時間ステップには日付と時刻、整数、または順序付けられたデータ型を指定できます。

TEXTキーワードとKEYキーワードは、ModelRegion 列に追加の系列キーが含まれていることを示します。系列キーは 1 つだけ使用でき、列の値は個別である必要があります。

次のコードを置き換えます。

< predictable attribute columns> )

次の内容に置き換えます。

[Quantity] LONG CONTINUOUS PREDICT,  
[Amount] DOUBLE CONTINUOUS PREDICT  
)

次のコードを置き換えます。
```
USING <algorithm name>([parameter list])  
WITH DRILLTHROUGH  
```
次の内容に置き換えます。
```
USING Microsoft_Time_Series(AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')  
WITH DRILLTHROUGH  
```
アルゴリズムパラメーター AUTO_DETECT_PERIODICITY = 0.8 は、アルゴリズムでデータ内のサイクルを検出することを示します。この値を 1 に近い値に設定すると、多くのパターンの検出が優先されますが、処理が遅くなる可能性があります。

アルゴリズムパラメーター FORECAST_METHODは、ARTXP、ARIMA、またはその両方を使用してデータを分析するかどうかを示します。

キーワード WITH DRILLTHROUGH、モデルの完了後にソースデータの詳細な統計情報を表示できるように指定します。 Microsoft タイムシリーズビューアーを使用してモデルを参照する場合は、この句を追加する必要があります。予測には必要ありません。

これで、完全なステートメントは次のようになります。
```
CREATE MINING MODEL [Forecasting_MIXED]  
     (  
    [Reporting Date] DATE KEY TIME,  
    [Model Region] TEXT KEY,  
    [Quantity] LONG CONTINUOUS PREDICT,  
    [Amount] DOUBLE CONTINUOUS PREDICT  
    )  
USING Microsoft_Time_Series (AUTO_DETECT_PERIODICITY = 0.8, FORECAST_METHOD = 'MIXED')  
WITH DRILLTHROUGH  
```
[ ファイル ] メニューの [ DMXQuery1.dmx As の保存] をクリックします。
[ 名前を付けて保存 ] ダイアログボックスで、適切なフォルダーを参照し、ファイルに Forecasting_MIXED.dmx名前を付けます。

クエリの実行

最後の手順では、クエリを実行します。クエリを作成して保存したら、サーバー上にマイニングモデルとそのマイニング構造を作成するために実行する必要があります。クエリエディターでのクエリの実行の詳細については、「データベースエンジンクエリエディター (SQL Server Management Studio)」を参照してください。

クエリを実行するには

クエリエディターのツールバーの [ 実行] をクリックします。

ステートメントの実行が完了すると、クエリエディターの下部にある [ メッセージ ] タブにクエリの状態が表示されます。メッセージが表示されます。
```
Executing the query   
Execution complete  
```
Forecasting_MIXED_Structureという名前の新しい構造が、関連するマイニングモデル Forecasting_MIXEDと共にサーバー上に存在するようになりました。

次のレッスンでは、先ほど作成した Forecasting_MIXED マイニング構造にマイニングモデルを追加します。

次のレッスン

レッスン 2: 時系列マイニング構造へのマイニングモデルの追加

こちらもご覧ください

時系列モデルのマイニングモデルコンテンツ (Analysis Services - データマイニング)
Microsoft タイムシリーズアルゴリズム技術リファレンス

Last updated on 2017-06-13