マイニング構造列

[アーティクル]
07/30/2013

マイニング構造を作成するときは、外部データの列を選択し、データをどのようにモデリングに使用するかを指定して、マイニング構造の列を定義します。したがって、マイニング構造列は、単なるデータソースのデータのコピーではなく、マイニングモデルでソースのデータがどのように使用するかを定義するものです。データの分離方法を決定するプロパティ (データ値の分布を記述するプロパティ) を割り当てることができます。

マイニング構造列は、柔軟性と拡張性を併せ持つように設計されています。これは、マイニングモデルの作成に使用する各アルゴリズムによって、構造内のさまざまな列を使用してデータが解釈される場合があるためです。モデルごとに 1 つずつデータセットを用意する代わりに、1 つのマイニング構造を使用し、そこに含まれる列を使用して各モデルのデータをカスタマイズできます。

マイニング構造列の定義

構造列を定義する基本データ型およびコンテンツの種類は、構造を作成するために使用するデータソースから派生します。これらの設定はマイニング構造内で変更でき、モデリングフラグの設定や連続した列の分布の設定も行うことができます。

マイニング構造列の定義には、次の情報を含める必要があります。

ID: 列の一意の名前。通常は名前と同じです。マイニング構造の作成後、名前は変更することができますが、ID は変更できません。
名前: 列の名前または別名。
コンテンツ: データが不連続であるか連続であるかを表す列挙体。
型: 一般的なデータ型を示す列挙体。
分布: 予想される値の分布を示す列挙体。分布は列が連続している場合に含まれます。
モデリングフラグ: 不足値などの処理方法を示す列挙体。モデリングフラグはマイニングモデルに対して定義することもできますが、モデルフラグは構造列に使用されるフラグとは異なります。
バインド: ソースデータを指定するプロパティ。

サードパーティのアルゴリズムには、マイニング構造列で定義できるカスタムプロパティが含まれている場合があります。

データマイニング構造とデータマイニングモデルの詳細については、「マイニング構造 (Analysis Services - データマイニング)」を参照してください。

関連コンテンツ

マイニング構造列を定義および使用する方法の詳細については、次のトピックを参照してください。

トピック	リンク
マイニング構造列の定義に使用できるデータ型について説明します。	データ型 (データマイニング)
マイニング構造列に含まれるデータのそれぞれの型に対して使用できるコンテンツの種類について説明します。コンテンツの種類はデータ型に依存します。コンテンツの種類はモデルレベルで割り当てられ、モデルで列データを使用する方法を決定します。	コンテンツの種類 (データマイニング)
入れ子になったテーブルの概念を紹介し、入れ子になったテーブルをマイニング構造列としてデータソースに追加する方法について説明します。	分類済みの列 (データマイニング)
予想される列の値の分布を指定するためにマイニング構造列に設定できる分布プロパティについて説明します。	列の分布 (データマイニング)
分離 (ビン分割と呼ばれることもあります) の概念について説明し、連続する数値データを分離するために Analysis Services に用意されている方法について説明します。	分離メソッド (データマイニング)
マイニング構造列に設定できるモデリングフラグについて説明します。	モデリングフラグ (データマイニング)
マイニング構造列どうしを関連付けるために使用できる特殊な列である分類済みの列について説明します。	分類済みの列 (データマイニング)
マイニング構造列を追加および変更する方法について説明します。	マイニング構造のタスクと操作方法

次の方法で共有

マイニング構造列

マイニング構造列の定義

関連コンテンツ

関連項目

概念

その他のリソース