予測用のデータ ソース ビューの追加 (中級者向けデータ マイニング チュートリアル)
この作業では、予測シナリオに使用するデータ ソース ビューを追加します。 予測モデルでは、時系列内のステップを識別するための列がデータに含まれている必要があります。 複数の系列のデータを分析する場合は、すべての系列が終了する日付または時間ステップが同じである必要があります。
データ ソース ビューを追加するには
ソリューション エクスプローラーで [データ ソース ビュー] を右クリックし、[新しいデータ ソース ビュー] をクリックします。
[データ ソース ビュー ウィザードへようこそ] ページで [次へ] をクリックします。
[データ ソースの選択] ページの [リレーショナル データ ソース] で、 AdventureWorksDW2012 データ ソースを選択します。 [次へ] をクリックします。
注 このデータ ソースがない場合は、「基本的なデータ マイニング チュートリアル」でデータ ソースを作成する手順を参照してください。
[テーブルとビューの選択] ページで vTimeSeries (dbo) テーブルを選択し、右矢印をクリックしてデータ ソース ビューに追加します。
[次へ] をクリックします。
既定では、 Adventure Works DW Multidimensional 2012 という名前のデータ ソース ビューが [ウィザードの完了] ページに表示されます。 この名前を SalesByRegion に変更し、[完了] をクリックします。
データ ソース ビュー デザイナーが開き、SalesByRegion データ ソース ビューが表示されます。
データ ソース ビューの使用
データ ソース ビューを作成したら、次の方法でデータを検証できます。
デザイナーで vTimeSeries テーブルを右クリックし、[データの探索] をクリックして、選択したテーブルをグリッドに開きます。
[サンプリング オプション] をクリックし、[データ探索オプション] ダイアログ ボックスを使用してサンプリング方法を変更します。 [最新の情報に更新] をクリックし、新しいオプション設定を使用してテーブルにデータを読み込みます。 たとえば、サンプルに出力する行数を指定したり、最初の n 行を選択したりできます。
vTimeSeries テーブルを右クリックし、[プロパティ] をクリックしてテーブルに新しい名前を割り当てます。 データ ソース ビューから個々の列を選択して、列のプロパティを変更することもできます。
データ ソース ビューのデザイン領域の任意の場所をクリックして、新しいクエリの作成と名前の割り当て、テーブル間のリレーションシップの作成、デザイン領域のレイアウトの変更を行います。
テーブルを右クリックし、[新しい名前付き計算] をクリックして、集計を含む派生列を作成します。 また、このビューではデータ ソースから新しいテーブルやビューを追加することもできます。
次の作業では、時系列データについて学習し、時系列識別子として使用するのに最適な列を決定します。 時系列データのギャップを処理する方法についても学習します。
このレッスンの次の作業
時系列モデルの要件について (中級者向けデータ マイニング チュートリアル)