予測モデルの検証 (中級者向けデータ マイニング チュートリアル)
予測マイニング モデルが作成できたので、次は、データ マイニング デザイナーの [マイニング モデル ビューアー] タブを使用して結果を検証してみましょう。Microsoft タイム シリーズ ビューアーには、[グラフ] タブと [モデル] タブがあります。
ここで作成した予測マイニング モデルは、3 つの地域 (ヨーロッパ、北米、および太平洋) における 2005 ~ 2010 年の製品売上を示すモデルです。したがって、Microsoft タイム シリーズ アルゴリズムでは、地域、製品、および予測可能な属性のそれぞれ異なる組み合わせを含む複数のツリーから成る 1 つの時系列モデルが作成されます。
ビューアーの各タブでは、完全な時系列モデルの情報をそれぞれ異なる方法で表示します。
[グラフ] タブ
[モデル] タブ
汎用コンテンツ ツリー ビューアー
[グラフ] タブ
Microsoft タイム シリーズ ビューアーの [グラフ] タブには、アルゴリズムによって作成された各ツリーがグラフィカルに表示されます。各時系列ツリーには、製品、地域、および予測可能な属性の一意の組み合わせが含まれます。
ビューアーの右側の凡例には、ドロップダウン リストで選択したすべての時系列が表示されます。さらに、各時系列の横にはチェック ボックスが表示されます。凡例で、これらのチェック ボックスをオンまたはオフにして、ビューアーに表示する時系列を指定できます。
各時系列に対して使用する色などの表示オプション、またはグラフの点に値を表示するかどうかを変更することもできます。
時系列を選択するには
[マイニング モデル ビューアー] タブの [グラフ] タブをクリックします (表示されていない場合)。
グラフ ビューの右側にあるドロップダウン リストをクリックし、すべてのチェック ボックスをオンにします。グラフに 24 本の異なる系列線が表示されます。
[OK] をクリックします。
グラフの右側にあるチェック ボックスをオフにして、Amount に基づくすべての系列の線を一時的に非表示にします。
次に、R750 と R250 という自転車に関連するチェック ボックスをオフにします。
これで、グラフに含まれる系列線は次の 6 つだけになるため、M200 と T1000 という自転車の傾向を比較しやすくなります。
M200 Europe: Quantity
M200 North America: Quantity
M200 Pacific: Quantity
T1000 Europe: Quantity t
T1000 North America: Quantity
T1000 Pacific: Quantity
グラフには、履歴データと予測データの両方が表示されます。履歴データと区別できるよう、予測データの部分は網掛けされています。個々の系列を比較しやすくするために、グラフのそれぞれの線に関連付けられている色を変更することもできます。詳細については、「データ マイニング ビューアで使用する色を変更する方法」を参照してください。
これらの傾向線からは、どの地域でも総売上がしだいに増加しており、12 か月目 (つまり 12 月) でピークに達していることがわかります。予測値は通常、この傾向に基づいて算出されます。またグラフでは、T1000 という自転車のデータが他の製品系列のデータより大幅に遅れて始まっていることも示されています。
Analysis Services では、各時系列について既定で 5 つの予測期間が表示されます。この値を変更して、表示する予測期間を増減することもできます。また、グラフに誤差範囲を追加して、予測の標準偏差をグラフィカルに表示することもできます。
グラフ ビューの予測オプションと表示オプションを変更するには
[予測期間] の値を 5 から 10 まで徐々に変更してから 6 に戻します。
注 履歴データでの変動幅が大きい傾向線では、予測時に変動が増幅されています。
[偏差の表示] チェック ボックスをオンにします。
M200 系列の誤差範囲にマウス カーソルを置きます。
T1000 Pacific 系列の誤差範囲にマウス カーソルを置きます。
これらの結果を使用してさらなる調査を行った後、すべての地域を平均して変動の影響を小さくしたモデルを開発します。
トップに戻る
[モデル] タブ
データ マイニング デザイナーで、Microsoft タイム シリーズ ビューアーの [モデル] タブを使用して、時系列をデシジョン ツリー グラフとして表示できます。モデルに含まれている系列ごとに個別のツリーが計算されます。時系列モデルでは、デシジョン ツリー グラフに単一のノードが含まれる場合もあれば (時系列が線形の場合)、通常のデシジョン ツリーのように、各分岐に関連付けられた複数のノードと条件が含まれる場合もあります。
時系列に対応するデシジョン ツリー グラフのノードには、次のいくつかの情報が含まれます。
予測可能な属性の状態を [背景] で指定している場合は、そのノードにおけるケースの集中度。ツリーの各オブジェクトの正確なケース数は凡例ウィンドウに表示されます。また、ツリーのオブジェクト上にマウス カーソルを置くと、そのオブジェクトに関する情報が表示されます。
ノードの回帰式。ARTxp 回帰式はリーフ ノードでのみ使用できます。ARIMA 式はツリーのルート ノードで使用できます。
属性の範囲を表すダイヤモンド グラフ。このダイヤモンドはノードの平均位置に配置され、ダイヤモンドの幅はそのノードにおける属性の分布 (ばらつき) を表します。
時系列モデルに対応するデシジョン ツリーを表示するには
タイム シリーズ ビューアーの [モデル] タブをクリックし、[ツリー] ボックスの一覧で [M200 North America: Amount] 系列を選択します。
グラフに単一のノードが表示されます。
そのノードの上にマウス カーソルを置きます。
[すべて] ノードについて表示されるツールヒントには、系列全体のケースの数や、データの分析から得られた時系列式などの情報が含まれます。
ノードをクリックして [マイニング凡例] を表示します。
[マイニング凡例] にはツールヒントと同じような情報が含まれていますが、そのほかに、値のヒストグラムなどの詳細情報も表示されます。
タイム シリーズ ビューアーの [モデル] タブをクリックし、[ツリー] ボックスの一覧で [M200 Pacific: Amount] 系列を選択します。
この時点で、ツリー グラフには [すべて] ノードと 2 つの子ノードが含まれています。子ノードのテキストは、ツリーを分割する条件の説明です。
いずれかの子ノードの上にマウス カーソルを置いてツールヒントの内容を確認します。または、ノードをクリックして [マイニング凡例] を表示します。
子ノードの説明には、ツリーの各分岐のケースの数や、ツリーが分割される原因になった追加の条件などの情報が含まれます。
トップに戻る
汎用コンテンツ ツリー ビューアー
Analysis Services には、時系列用のカスタム ビューアーのほかに、Microsoft 汎用コンテンツ ツリー ビューアーが用意されています。このビューアーは、使用したアルゴリズムに関係なく、すべてのデータ マイニング モデルで使用できます。汎用コンテンツ ツリー ビューアーは、[ビューアー] ドロップダウン リストから起動できます。
このビューアーでは各マイニング モデルが、分析に使用したデータやアルゴリズムに関係なく、一連のノードを含むツリーとして表されます。各ノードは、データのサブセットに関する情報を表します。ノードの正確な内容はアルゴリズムや予測可能な属性の種類に応じて変わりますが、内容の全体的なスキーマは同じです。
ここで作成したデータ マイニング モデルは ARTXP と ARIMA の両方のアルゴリズムを組み合わせた混合モデルなので、Analysis Services により、各アルゴリズムを使用して各時系列の ARTXP モデルと ARIMA モデルが個別に作成されます。Microsoft タイム シリーズ ビューアーを使用して予測マイニング モデルを参照すると、Analysis Services によって 2 つのアルゴリズムの結果が組み合わされて、マイニング モデルが 1 つのツリーとして表示されます。ツリーの各ノードには、2 つのアルゴリズムの一部の内容が含まれます。
一方、Microsoft 汎用コンテンツ ツリー ビューアーを使用すると、各アルゴリズムによって生成された内容が予測マイニング モデル内の 2 種類のノードとして表示されます。ARTXP または ARIMA のいずれかのバージョンのモデルを使用してドリル ダウンすると、より詳細な情報を取得できます。
汎用コンテンツ ビューアーで特定のデータ系列の詳細を表示するには
[マイニング モデル ビューアー] タブの [ビューアー] ボックスの一覧で、[Microsoft 汎用コンテンツ ツリー ビューアー] を選択します。
[ノードのキャプション] ペインで最上位ノード ([すべて]) をクリックします。
[ノードの詳細] ペインで ATTRIBUTE_NAME の値を表示します。
この値から、このノードにどの系列 (製品と地域の組み合わせ) が含まれているかがわかります。AdventureWorks の例では、最上位ノードは M200 Europe 系列のノードです。
[ノードのキャプション] ペインで、子ノードがある最初のノードを見つけます。
系列のノードに子がある場合は、Microsoft タイム シリーズ ビューアーの [モデル] タブに表示されるツリー ビューにも分岐構造が含まれます。
ノードを展開し、いずれかの子ノードをクリックします。
スキーマの NODE_DESCRIPTION 列に、ツリーが分割される原因になった条件が含まれています。
[ノードのキャプション] ペインで最上位の ARIMA ノードをクリックし、すべての子ノードが表示されるまでそのノードを展開します。
[ノードの詳細] ペインで ATTRIBUTE_NAME の値を表示します。
この値から、このノードに含まれている時系列がわかります。ARIMA セクションの最上位ノードは [(すべて)] セクションの最上位ノードと一致するはずです。AdventureWorks の例では、このノードには M200 Europe 系列に対する ARIMA 分析が含まれています。
詳細については、「タイム シリーズ モデルのマイニング モデル コンテンツ (Analysis Services - データ マイニング)」を参照してください。
トップに戻る