予測モデルの予測の比較 (中間データマイニングチュートリアル)

このチュートリアルの前の手順では、複数の時系列モデルを作成しました。

個々のモデルとリージョンのデータのみに基づく、リージョンとモデルの各組み合わせの予測。
更新されたデータに基づく各リージョンの予測。
集計データに基づく、世界中のすべてのモデルの予測。
集計モデルに基づく北米リージョンの M200 モデルの予測。

時系列予測の特徴を要約するために、変更を確認して、オプションを使用してデータを拡張または置き換える方法が予測結果に与える影響を確認します。

データを追加した後の元の結果と結果の比較

太平洋地域の M200 製品ラインのデータを見て、新しいデータでモデルを更新することが結果にどのように影響するかを確認しましょう。元のデータ系列は 2004 年 6 月に終了し、7 月、8 月、9 月の新しいデータを取得したことを思い出してください。

最初の列には、追加された新しいデータが表示されます。
2 番目の列には、元のデータ系列に基づく 7 月以降の予測が表示されます。
3 番目の列には、拡張データに基づく予測が表示されます。

M200 Pacific	実際の売上データを更新しました	データが追加される前の予測	拡張予測
7-25-2008	65	32	65
8-25-2008	54	37	54
9-25-2008	61	32	61
10-25-2008	データなし	36	32
11-25-2008	データなし	31	41
12-25-2008	データなし	34	32

拡張データ (太字で示します) を使用した予測では、実際のデータポイントが正確に繰り返されることに注意してください。繰り返しは仕様です。使用する実際のデータポイントがある限り、予測クエリは実際の値を返し、新しい実際のデータポイントが使用された後にのみ新しい予測値を出力します。

一般に、アルゴリズムは、モデルデータの先頭からのデータよりも、新しいデータの変更をより厳密に重み付けします。ただし、この場合、新しい売上の数値は前の期間に対して 20 ~ 30% の増加しか示さないため、予想される売上がわずかに増加しただけで、その後は、新しいデータの前月の傾向に沿って、売上予測が再び減少します。

元の予測結果とクロス予測結果の比較

元のマイニングモデルでは、リージョン間と製品ライン間の大きな違いが明らかになったことに注意してください。たとえば、M200 モデルの売上は非常に高く、T1000 モデルの売上はすべての地域でかなり低かったとします。さらに、一部のシリーズには多くのデータがありませんでした。シリーズは不規則で、開始点が一貫していませんでした。

M200 および T1000 数量を予測するシリーズ

では、元のデータセットではなく、世界全体の売上に基づく一般的なモデルに基づいて予測を行った場合、予測はどのように変わるのでしょうか。情報を失ったり、予測を歪めたりしないようにするには、結果をテーブルに保存し、予測テーブルを履歴データのテーブルに結合してから、2 セットの履歴データと予測をグラフ化します。

次の図は、1 つの製品ライン M200 のみに基づいています。グラフでは、最初のマイニングモデルからの予測と、集計されたマイニングモデルを使用した予測が比較されます。

予測を比較する Excel グラフ

この図から、集計されたマイニングモデルでは、個々のデータ系列の変動を最小限に抑えながら、値の範囲と傾向全体が保持されていることがわかります。

結論

予測に使用できる時系列モデルを作成およびカスタマイズする方法を学習しました。

新しいデータを追加し、パラメーター (EXTEND_MODEL_CASES) を使用して予測を作成することで、時系列モデルを再処理することなく更新する方法について学習しました。

REPLACE_MODEL_CASES パラメーターを使用し、モデルを別のデータ系列に適用することで、クロス予測に使用できるモデルを作成する方法について学習しました。

こちらもご覧ください

中間データマイニングチュートリアル (Analysis Services - データマイニング)
タイムシリーズモデルクエリの例

Last updated on 2017-03-06

次の方法で共有

予測モデルの予測の比較 (中間データ マイニング チュートリアル)

データを追加した後の元の結果と結果の比較

元の予測結果とクロス予測結果の比較

結論

こちらもご覧ください

その他のリソース

予測モデルの予測の比較 (中間データマイニングチュートリアル)