新規の OLAP マイニング構造の作成

[アーティクル]
06/13/2017

Microsoft SQL Server Analysis Services のデータマイニングウィザードを使用して、多次元モデルのデータを使用するマイニング構造を作成できます。 OLAP キューブに基づくマイニングモデルでは、ファクトテーブルの列と値、ディメンション、およびメジャーグループを分析の属性として使用できます。

新規の OLAP マイニング構造を作成するには

SQL Server Data Tools (SSDT) のソリューションエクスプローラーで、Analysis Services プロジェクトの [マイニング構造] フォルダーを右クリックし、[新しいマイニング構造] をクリックしてデータマイニングウィザードを開きます。
[データマイニングウィザードへようこそ] ページで [次へ]をクリックします。
[定義方法の選択] ページで、 [既存のキューブを使用する]を選択して [次へ]をクリックします。

[サポートされているデータマイニングアルゴリズムの一覧を取得できません] というエラーが表示される場合は、 [プロジェクトのプロパティ] ダイアログボックスを開き、多次元モデルをサポートする Analysis Services インスタンスの名前を指定したことを確認します。テーブルモデリングをサポートする Analysis Services のインスタンスでマイニングモデルを作成することはできません。
[データマイニング構造の作成] ページで、マイニング構造のみを作成するか、マイニング構造および関連するマイニングモデルを 1 つ作成するかを決定します。一般には、必要な列を含めるよう求めるプロンプトが表示されるように、マイニングモデルを同時に作成する方が簡単です。

マイニングモデルを作成する場合は、使用するデータマイニングアルゴリズムを選択して、 [次へ]をクリックします。アルゴリズムの選択方法の詳細については、「データマイニングアルゴリズム (Analysis Services - データマイニング)」を参照してください。
[ソースキューブディメンションの選択] ページの [ソースキューブディメンションの選択]で、ケースデータの大半を含むディメンションを探します。

たとえば、顧客グループを識別しようとしている場合は、Customer ディメンションを選択できます。複数の取引の購買を分析しようとしている場合は、Internet Sales Order Details ディメンションを選択できます。このディメンションのデータのみ使用するように制限はされませんが、分析で使用する重要属性を含める必要があります。

[次へ] をクリックします。
[ケースキーの選択] ページの [属性]で、マイニング構造のキーにする属性を選択して、 [次へ]をクリックします。

通常、マイニング構造のキーとして使用する属性は、ディメンションのキーにもなり、事前に選択されます。
[ケースレベル列の選択] ページの [関連する属性およびメジャー]で、マイニング構造にケースデータとして追加する値が格納された属性とメジャーを選択します。 [次へ] をクリックします。
[マイニングモデル列の使用法の指定] ページの [マイニングモデル構造]で、最初に予測可能列を設定してから、入力として使用する列を選択します。
- 一番左の列のチェックボックスをオンにして、データをマイニング構造に含めます。参照に使用する構造に列を含めることができますが、分析に使用することはできません。
- [入力] 列のチェックボックスをオンにして、分析で属性を変数として使用します。
- 予測可能な属性についてのみ、 [予測] 列のチェックボックスをオンにします。
キーとして指定した列を入力または予測に使用することはできません。

[次へ] をクリックします。
[マイニングモデル列の使用法の指定] ページの [入れ子になっているテーブルの追加] および [入れ子になったテーブル]を使用して、入れ子になったテーブルをマイニング構造に対して追加または削除することもできます。

OLAP マイニングモデルでは、入れ子になったテーブルとは、ケース属性を表すディメンションとの間に一対多リレーションシップがあるキューブ内のデータの別のセットです。したがって、ダイアログボックスが開いたときに、ケーステーブルとして選択したディメンションに既に関連しているメジャーグループが事前に選択されています。この時点で、分析に役立つ追加情報を格納している別のディメンションを選択します。

たとえば、顧客を分析している場合は、[Customer] ディメンションをケーステーブルとして使用します。入れ子になったテーブルでは、購入を行うときに顧客が示した理由を追加できます。これは [Sales Reason] ディメンションに含まれています。

入れ子になったデータを追加する場合は、次の 2 つの列を追加で指定する必要があります。
- 入れ子になったテーブルのキー: これは、 [入れ子になったテーブルキーの選択]ページで事前に選択されています。
- 分析に使用する属性: [入れ子になったテーブル列の選択]ページでは、入れ子になったテーブルの選択でメジャーと属性の一覧が表示されます。
  - モデルに含める属性ごとに、左の列のボックスをオンにします。
  - 属性を分析にのみ使用する場合は、 [入力]をオンにします。
  - 列をモデルの予測可能属性の 1 つとして含める場合は、 [予測]を選択します。
  - 構造に含め、入力または予測可能属性として指定しないアイテムは、Ignore フラグ付きで構造に追加されます。これは、データがモデルの作成時に処理され、分析には使用されず、ドリルスルーにのみ使用できることを意味します。これは、顧客名などの詳細を含めるが、分析で使用したくない場合に便利です。
[終了] をクリックして、入れ子になったテーブルを処理するウィザードの部分を終了します。プロセスを繰り返して、複数の入れ子になった列を追加できます。
[列のコンテンツおよびデータ型の指定] ページの [マイニングモデル構造]で、各列のコンテンツの種類とデータ型を設定します。

注意

OLAP マイニングモデルでは、 [検出] 機能を使用して、連続したデータと連続しないデータのどちらが列に含まれているかを自動的に検出することはできません。

[次へ] をクリックします。
[ソースキューブのスライス] ページでは、マイニング構造の作成に使用されるデータをフィルター選択できます。

キューブをスライスすると、モデルの作成に使用されるデータを制限できます。たとえば、Geography 階層と以下のアイテムでスライスすることにより、地域ごとに異なるモデルを作成できます。
- ディメンション: ドロップダウンリストから、関連するディメンションを選択します。
- 階層: フィルターを適用するディメンション階層のレベルを選択します。たとえば、[Geography] ディメンションでスライスする場合は、[Region Country Name] などの階層レベルを選択します。
- 演算子: 一覧から演算子を選択します。
- フィルター式: フィルター条件として使用する値または式を入力するか、ドロップダウンリストを使用して、指定した階層レベルでメンバーの一覧から値を選択します。
  
  たとえば、ディメンションとして [Geography] を選択し、階層レベルとして [Region Country Name] を選択した場合、ドロップダウンリストには、フィルター条件として使用できるすべての有効な国/地域が含まれます。複数選択することができます。その結果、マイニング構造内のデータは、これらの地域のキューブデータに制限されます。
- パラメーター: このチェックボックスは無視します。このダイアログボックスでは複数のキューブフィルターシナリオがサポートされ、このオプションはマイニング構造の作成に関係しません。
[次へ] をクリックします。
[トレーニングセットとテストセットにデータを分割します] ページで、テスト用に予約するマイニング構造データの割合を指定するか、テストケースの最大数を指定します。 [次へ] をクリックします。

両方の値を指定した場合、それらの制限のうちの低い方が使用されます。
[ウィザードの完了] ページで、新しい OLAP マイニング構造と初期マイニングモデルの名前を指定します。
[完了] をクリックします。
[ウィザードの完了] ページで、マイニングモデルディメンションまたはマイニングモデルディメンションを使用するキューブ、あるいはその両方を作成することもできます。これらのオプションは、次のアルゴリズムを使用して作成されるモデルに対してのみサポートされます。
- Microsoft クラスタリングアルゴリズム
- Microsoft デシジョンツリーアルゴリズム
- Microsoft アソシエーションルールアルゴリズム
[マイニングモデルディメンションを作成する]: このチェックボックスをオンにして、マイニングモデルディメンションの種類名を指定します。このオプションを使用すると、マイニング構造の作成に使用された元のキューブ内に新しいディメンションが作成されます。このディメンションを使用してドリルダウンし、さらに分析を実行できます。ディメンションはキューブ内にあるため、ディメンションは自動的にケースデータディメンションにマップされます。

[マイニングモデルディメンションを使用してキューブを作成する]: このチェックボックスをオンにし、新しいキューブの名前を指定します。このオプションを使用する場合、構造の作成に使用された既存のディメンションと、モデルからの結果を格納する新しいデータマイニングディメンションを含む新しいキューブが作成されます。

参照

マイニング構造のタスクと操作方法

次の方法で共有

新規の OLAP マイニング構造の作成

新規の OLAP マイニング構造を作成するには

参照

その他のリソース