このチュートリアルの前の手順では、複数の時系列モデルを作成しました。
個々のモデルとリージョンのデータのみに基づく、リージョンとモデルの各組み合わせの予測。
更新されたデータに基づく各リージョンの予測。
集計データに基づく、世界中のすべてのモデルの予測。
集計モデルに基づく北米リージョンの M200 モデルの予測。
時系列予測の特徴を要約するために、変更を確認して、オプションを使用してデータを拡張または置き換える方法が予測結果に与える影響を確認します。
データを追加した後の元の結果と結果の比較
太平洋地域の M200 製品ラインのデータを見て、新しいデータでモデルを更新することが結果にどのように影響するかを確認しましょう。 元のデータ系列は 2004 年 6 月に終了し、7 月、8 月、9 月の新しいデータを取得したことを思い出してください。
最初の列には、追加された新しいデータが表示されます。
2 番目の列には、元のデータ系列に基づく 7 月以降の予測が表示されます。
3 番目の列には、拡張データに基づく予測が表示されます。
| M200 Pacific | 実際の売上データを更新しました | データが追加される前の予測 | 拡張予測 |
|---|---|---|---|
| 7-25-2008 | 65 | 32 | 65 |
| 8-25-2008 | 54 | 37 | 54 |
| 9-25-2008 | 61 | 32 | 61 |
| 10-25-2008 | データなし | 36 | 32 |
| 11-25-2008 | データなし | 31 | 41 |
| 12-25-2008 | データなし | 34 | 32 |
拡張データ (太字で示します) を使用した予測では、実際のデータ ポイントが正確に繰り返されることに注意してください。 繰り返しは仕様です。 使用する実際のデータ ポイントがある限り、予測クエリは実際の値を返し、新しい実際のデータ ポイントが使用された後にのみ新しい予測値を出力します。
一般に、アルゴリズムは、モデル データの先頭からのデータよりも、新しいデータの変更をより厳密に重み付けします。 ただし、この場合、新しい売上の数値は前の期間に対して 20 ~ 30% の増加しか示さないため、予想される売上がわずかに増加しただけで、その後は、新しいデータの前月の傾向に沿って、売上予測が再び減少します。
元の予測結果とクロス予測結果の比較
元のマイニング モデルでは、リージョン間と製品ライン間の大きな違いが明らかになったことに注意してください。 たとえば、M200 モデルの売上は非常に高く、T1000 モデルの売上はすべての地域でかなり低かったとします。 さらに、一部のシリーズには多くのデータがありませんでした。 シリーズは不規則で、開始点が一貫していませんでした。
では、元のデータ セットではなく、世界全体の売上に基づく一般的なモデルに基づいて予測を行った場合、予測はどのように変わるのでしょうか。 情報を失ったり、予測を歪めたりしないようにするには、結果をテーブルに保存し、予測テーブルを履歴データのテーブルに結合してから、2 セットの履歴データと予測をグラフ化します。
次の図は、1 つの製品ライン M200 のみに基づいています。 グラフでは、最初のマイニング モデルからの予測と、集計されたマイニング モデルを使用した予測が比較されます。
この図から、集計されたマイニング モデルでは、個々のデータ系列の変動を最小限に抑えながら、値の範囲と傾向全体が保持されていることがわかります。
結論
予測に使用できる時系列モデルを作成およびカスタマイズする方法を学習しました。
新しいデータを追加し、パラメーター (EXTEND_MODEL_CASES) を使用して予測を作成することで、時系列モデルを再処理することなく更新する方法について学習しました。
REPLACE_MODEL_CASES パラメーターを使用し、モデルを別のデータ系列に適用することで、クロス予測に使用できるモデルを作成する方法について学習しました。
こちらもご覧ください
中間データ マイニング チュートリアル (Analysis Services - データ マイニング)
タイム シリーズ モデル クエリの例