予測マイニング モデルを構築したら、データ マイニング デザイナーの [ マイニング モデル ビューアー ] タブを使用して結果を調べることができます。 Microsoft Time Series Viewer には、 グラフ と モデルという 2 つのタブがあります。
さらに、すべてのモデルで Microsoft 汎用ツリー ビューアーを使用できます。 各ビューには、時系列モデルの情報の少し異なる画像が表示されます。
[グラフ] タブ
Microsoft Time Series Viewer の [ グラフ ] タブには、履歴データや予測など、各系列がグラフィカルに表示されます。 時系列グラフの各行は、製品、地域、予測可能な属性の一意の組み合わせを表します。
ビューアーの右側にある凡例には、ドロップダウン リストの選択内容に基づいて、使用可能な時系列が一覧表示されます。 凡例のチェックボックスを選択または解除して、グラフに表示される時系列を制御できます。
また、時系列ごとに使用される色や、グラフ内のポイントに値を表示するかどうかなど、表示オプションを変更することもできます。
時系列を選択するには
[マイニング モデル ビューアー] タブが表示されていない場合は、[グラフ] タブをクリックします。
グラフ ビューの右側にあるドロップダウン リストをクリックし、すべてのチェック ボックスをオンにします。 OK をクリックします。
これで、グラフに 24 の異なる系列線が含まれるようになります。
グラフの右側にあるチェック ボックスをオフにして、金額に基づくすべての系列の線を一時的に非表示にします。
次に、R750 と R250 の自転車に関連するチェック ボックスをオフにします。
グラフには次の 6 つの系列線だけが含まれるようになったため、M200 と T1000 の自転車の傾向をより簡単に比較できます。
M200 ヨーロッパ: 数量
M200 北米: 数量
M200 太平洋: 数量
T1000 ヨーロッパ: 数量
T1000 北米: 数量
T1000 Pacific: Quantity
このビューアーに表示されるグラフには、履歴データと予測データの両方が含まれます。 予測データは、履歴データと区別するために網掛けされます。 異なる系列を簡単に比較できるように、グラフの各行に関連付けられている色を変更することもできます。 詳細については、「 データ マイニング ビューアーで使用される色を変更する」を参照してください。
傾向線から、すべての地域の総売上が一般的に増加しており、ピークは 12 月に 12 か月ごとに行われることがわかります。 グラフから、T1000 自転車のデータは、他の製品シリーズのデータよりもはるかに遅く始まることがわかります。 これは新しい製品であるためですが、このシリーズははるかに少ないデータに基づいているため、予測ほど正確ではない可能性があります。
既定では、時系列ごとに 5 つの予測ステップが表示され、点線で表示されます。 この値を変更して、表示する予測を増減できます。 グラフに誤差範囲を追加して、予測の標準偏差をグラフィカルに表示することもできます。
グラフ ビューで予測と表示のオプションを変更するには
予測ステップの値を徐々に変更して、5 から 10 に増やしてから、6 に戻してみてください。
履歴データの変動が大きい場合、予測の数を増やすと、変動が繰り返されたり、増幅されたりする傾向があります。 おそらく、この時点で何らかの調査を行い、履歴データの大幅な増加の原因を理解し、これらの結果を受け入れるか、ソース データに何らかの修正を求めるか、モデルに何らかのスムージングを適用するかを決定する必要があります。
[ 偏差の表示 ] チェック ボックスをオンにします。
このオプションは、各予測値の推定誤差を表示します。
X 軸の目盛りを書き留めます。 履歴データと予測データの両方に対する変更は常にパーセンテージで表されますが、実際の値は、すべての値がグラフに収まるように自動的に調整されます。 そのため、モデルを比較する場合は、ビジュアルだけに依存しないように注意する必要があります。 正確な値、または予測の増加率と値を取得するには、点線または実線の上にマウスを置くか、線をクリックして マイニング凡例の値を表示します。
ヒント: [マイニング凡例 ] が表示されていない場合は、[ モデル ] ビューに切り替え、任意のノードを右クリックして、[ 凡例の表示] を選択します。
これらの傾向を見ると、一部のシリーズのデータ不足が懸念され、モデル別の売上の平均化や地域別の売上の平均化によって、より信頼性の高い予測が得られるかどうか疑問に思います。 この方法については、このチュートリアルの後のレッスンで説明します。
モデルタブ
データ マイニング デザイナーの Microsoft タイム シリーズ ビューアーの [ モデル ] タブでは、ツリー グラフの形式で予測モデルを表示できます。
まず、データには、3 つの異なるリージョン (ヨーロッパ、北米、太平洋) の複数の製品ライン (T1000 など) の売上に対する 2 つの異なるメジャー (量と数量) が記述されているため、実際に構築したモデルには 24 の異なるツリーが含まれていることに注意してください。各ツリーは、リージョン、製品、および製品の異なる組み合わせの販売パターンのモデルを表します。 と予測可能な属性。
[モデル] タブの [ツリー] ドロップダウン リストから系列を選択することで、表示する製品ライン、地域、および売上メトリックの組み合わせを選択できます。
では、モデルをツリーとして表示することで何を学ぶことができますか? たとえば、ツリー内に複数のレベルを持つモデルと、1 つのノードを持つモデルの 2 つを比較してみましょう。
ツリー グラフに 1 つのノードが含まれている場合は、モデルで見つかった傾向が、時間の経過と同時にほぼ同種であることを意味します。 この単一のノード (" すべて" というラベル) を使用して、入力変数と結果の関係を説明する数式を表示できます。
時系列のツリー グラフに複数の分岐がある場合は、検出された時系列が複雑すぎて 1 つの式として表現できないことを意味します。 代わりに、ツリー グラフに複数の分岐が含まれている場合があります。各分岐には、ツリーの分割の原因となった条件でラベルが付 けられます。 ツリーが分割されると、各分岐は時間の異なるセグメントを表し、その中で傾向を 1 つの式として記述できます。
たとえば、グラフ グラフを見て、9 月の 1 日から年末の休暇を経て販売量が急激に増加する場合は、[ モデル ] ビューに切り替えて、傾向が変化した正確な日付を確認できます。 "9 月より前" と "9 月以降" を表すツリーの分岐には、分割までの売上傾向を数学的に記述する数式と、9 月から年末の祝日までの売上傾向を表す別の数式など、さまざまな数式が含まれます。
時系列モデルのデシジョン ツリーを調べるには
ビューアーの [モデル] タブの [ツリー] リストで、T1000 Europe: Amount 系列を選択します。
[すべて] というラベルの付いたノードをクリックします。
[すべて] ノードの場合、表示されるツールヒントには、系列全体のケースの数、データの分析から派生した時系列数式などの情報が含まれます。
[マイニング凡例] が表示されていない場合は、ノードを右クリックし、[凡例の表示] を選択します。
[マイニング凡例] には、ツールヒントとほとんど同じ情報が表示されます。 独立変数のいずれかが不連続である場合は、ノード内の変数の分布を示すヒストグラムも表示されます。
次に、表示する別の時系列を選択します。 ビューアーの [モデル] タブの [ツリー] リストを使用して、[M200 North America: Amount] シリーズを選択します。
ツリー グラフには、 All ノードと 2 つの子ノードが含まれるようになりました。 子ノードのラベルを調べることで、傾向線が変化した時点を把握できます。
子ノードごとに、 マイニング凡例 の説明には、ツリーの各分岐のケースの数も含まれます。
次の一覧では、ツリー ビューアーの追加機能について説明します。
グラフで表される変数は、[ 背景 ] コントロールを使用して変更できます。 既定では、背景 の値が 人口 に設定されているため、暗いノードにはより多くのケースが含まれます。 ノード内に存在するケースの数のみを表示するには、ノードの上にマウス を置いて表示されるツールヒントを表示するか、ノードをクリックして [ ノードの凡例 ] ウィンドウに数値を表示します。
ノードの回帰式は、ツールヒントで表示することも、ノードをクリックして表示することもできます。 混合モデルを作成した場合は、ARTXP (リーフ ノード) 用と ARIMA (ツリーのルート ノード) 用の 2 つの数式が表示されます。
ノードで使用される小さなダイヤモンドは、連続数を表します。 属性の範囲は、ダイヤモンドが配置されたバーに表示されます。 ダイヤモンドはノードの平均を中心とし、ダイヤモンドの幅はそのノードの属性の分散を表します。
(省略可能)汎用コンテンツ ツリー ビューアー
Analysis Services には、時系列のカスタム ビューアーに加えて、すべてのデータ マイニング モデルで使用できる MicrosoftGeneric コンテンツ ツリー ビューアー が用意されています。 このビューアーには、いくつかの利点があります。
Microsoft Time Series Viewer: このビューでは、2 つのアルゴリズムの結果がマージされます。 各系列を個別に表示することはできますが、各アルゴリズムの結果がどのように組み合わされたかを判断することはできません。 また、このビューでは、ヒントとマイニング凡例に最も重要な統計のみが表示されます。
汎用コンテンツ ツリー ビューアー: モデルで一度に使用されていたすべてのデータ系列を参照して表示できます。混合モデルを作成した場合は、ARIMA ツリーと ARTXP ツリーの両方が同じグラフに表示されます。
このビューアーを使用すると、両方のアルゴリズムと値の分布からすべての統計情報を取得できます。
ARIMA および ARTXP 分析の詳細を知りたいデータ マイニングの専門家ユーザーに推奨されます。
汎用コンテンツ ビューアーで特定のデータ系列の詳細を表示するには
[マイニング モデル ビューアー] タブで、[ビューアー] ドロップダウン リストから [Microsoft 汎用コンテンツ ツリー ビューアー] を選択します。
[ ノード キャプション ] ウィンドウで、一番上の (すべて) ノードをクリックします。
[ ノードの詳細 ] ウィンドウで、ATTRIBUTE_NAMEの値を表示します。
この値は、このノードに含まれている系列(製品と地域の組み合わせ)を示します。 AdventureWorks の例では、最上位ノードは M200 Europe シリーズ用です。
[ ノード キャプション ] ウィンドウで、子ノードを含む最初のノードを見つけます。
系列ノードに子がある場合、Microsoft タイム シリーズ ビューアーの [ モデル ] タブに表示されるツリー ビューにも分岐構造があります。
ノードを展開し、いずれかの子ノードをクリックします。
スキーマのNODE_DESCRIPTION列には、ツリーの分割の原因となった条件が含まれています。
[ ノード キャプション ] ウィンドウで、最上位の ARIMA ノードをクリックし、すべての子ノードが表示されるまでノードを展開します。
[ ノードの詳細 ] ウィンドウで、ATTRIBUTE_NAMEの値を表示します。
この値は、このノードに含まれる時系列を示します。 ARIMA セクションの一番上のノードは、(All) セクションの一番上のノードと一致している必要があります。 AdventureWorks の例では、このノードにはシリーズ M200 Europe の ARIMA 分析が含まれています。
詳細については、「 タイム シリーズ モデルのマイニング モデル コンテンツ (Analysis Services - データ マイニング)」を参照してください。
このレッスンの次の作業
時系列予測の作成 (中間データ マイニング チュートリアル)