拡張売上データを使用した予測の作成
このレッスンでは、新しい売上データをモデルに追加する予測クエリを作成します。 新しいデータを使用してモデルを拡張することで、最新のデータ ポイントを含む up-to-date 予測を取得できます。
新しいデータを使用する時系列予測の作成は簡単です。単に、 PredictTimeSeries (DMX) 関数にパラメーター EXTEND_MODEL_CASESを追加し、新しいデータのソースを指定し、取得する予測の数を指定するだけです。
警告
パラメーター EXTEND_MODEL_CASESは省略可能です。既定では、新しいデータを入力として結合することで、時系列予測クエリを作成するたびにモデルが拡張されます。
予測クエリを作成して新しいデータを追加するには
モデルがまだ開いていない場合は、予測構造をダブルクリックし、データ マイニング デザイナーで [ マイニング モデル予測 ] タブをクリックします。
[ マイニング モデル ] ウィンドウで、モデル予測が既に選択されている必要があります。 選択されていない場合は、[モデルの 選択] をクリックし、モデルの予測を選択します。
[ 入力テーブルの選択 ] ウィンドウで、[ ケース テーブルの選択] をクリックします。
[ テーブルの選択 ] ダイアログ ボックスで、データ ソースである Adventure Works DW 多次元 2012 を選択します。
データ ソース ビューの一覧から NewSalesData を選択し、[OK] をクリック します。
デザイン領域のサーフェスを右クリックし、[接続の 変更]を選択します。
[ マッピングの変更 ] ダイアログ ボックスを使用して、次のようにモデル内の列を外部データの列にマップします。
マイニング モデルの ReportingDate 列を、入力データの NewDate 列にマップします。
マイニング モデルの Amount 列を、入力データの NewAmount 列にマップします。
マイニング モデルの Quantity 列を入力データの NewQty 列にマップします。
マイニング モデルの ModelRegion 列を入力データの系列列にマップします。
次に、予測クエリを作成します。
まず、予測クエリに列を追加して、予測が適用される系列を出力します。
グリッドで、最初の空の行をクリックし、[ ソース] で [予測] を選択します。
[フィールド] 列で[モデル領域]を選択し、[エイリアス]に「
Model Region
」と入力します。
次に、予測関数を追加して編集します。
空の行をクリックし、[ ソース] で [ 予測関数] を選択します。
[フィールド] で、[PredictTimeSeries] を選択します。
[エイリアス] に「予測値」と入力します。
[ マイニング モデル ] ペインから [ 抽出条件]/[引数] 列に [数量] フィールドをドラッグします。
[ 抽出条件/引数] 列のフィールド名の後に、次のテキストを入力します: 5,EXTEND_MODEL_CASES
[ 抽出条件/引数 ] テキスト ボックスの完全なテキストは次のようになります。
[Forecasting].[Quantity],5,EXTEND_MODEL_CASES
[ 結果 ] をクリックし、結果を確認します。
予測は 7 月 (元のデータの終了後の最初のタイム スライス) から始まり、11 月 (元のデータの終了後の 5 番目のタイム スライス) に終了します。
この種類の予測クエリを効果的に使用するには、古いデータがいつ終了したかと、新しいデータに含まれるタイム スライスの数を把握する必要があることがわかります。
たとえば、このモデルでは、元のデータ系列は 6 月に終了し、データは 7 月、8 月、9 月の月のデータです。
EXTEND_MODEL_CASESを使用する予測は、常に元のデータ系列の末尾から始まります。 そのため、不明な月の予測のみを取得する場合は、予測の開始点と終点を指定する必要があります。 どちらの値も、古いデータの末尾から始まるタイム スライスの数として指定されます。
次の手順では、これを行う方法を示します。
予測の始点と終点を変更する
予測クエリ ビルダーで、[ クエリ ] をクリックして DMX ビューに切り替えます。
PredictTimeSeries 関数を含む DMX ステートメントを見つけて、次のように変更します。
PredictTimeSeries([Forecasting 12].[Quantity],4,6,EXTEND_MODEL_CASES)
[ 結果 ] をクリックし、結果を確認します。
これで、予測は 10 月 (4 番目のタイム スライス、元のデータの末尾からカウント) から始まり、12 月に終了します (6 番目のタイム スライスは元のデータの末尾からカウントされます)。
このレッスンの次の作業
置換データを使用した時系列予測 (中間データ マイニング チュートリアル)
こちらもご覧ください
Microsoft タイム シリーズ アルゴリズム技術リファレンス
時系列モデルのマイニング モデル コンテンツ (Analysis Services - データ マイニング)