マイニング構造列
マイニング構造を作成するときは、外部データの列を選択し、データをどのようにモデリングに使用するかを指定して、マイニング構造の列を定義します。 したがって、マイニング構造列は、単なるデータ ソースのデータのコピーではなく、マイニング モデルでソースのデータがどのように使用するかを定義するものです。 データの分離方法を決定するプロパティ (データ値の分布を記述するプロパティ) を割り当てることができます。
マイニング構造列は、柔軟性と拡張性を併せ持つように設計されています。これは、マイニング モデルの作成に使用する各アルゴリズムによって、構造内のさまざまな列を使用してデータが解釈される場合があるためです。 モデルごとに 1 つずつデータ セットを用意する代わりに、1 つのマイニング構造を使用し、そこに含まれる列を使用して各モデルのデータをカスタマイズできます。
マイニング構造列の定義
構造列を定義する基本データ型およびコンテンツの種類は、構造を作成するために使用するデータ ソースから派生します。 これらの設定はマイニング構造内で変更でき、モデリング フラグの設定や連続した列の分布の設定も行うことができます。
マイニング構造列の定義には、次の情報を含める必要があります。
ID: 列の一意の名前。通常は名前と同じです。 マイニング構造の作成後、名前は変更することができますが、ID は変更できません。
名前: 列の名前または別名。
コンテンツ: データが不連続であるか連続であるかを表す列挙体。
型: 一般的なデータ型を示す列挙体。
分布: 予想される値の分布を示す列挙体。 分布は列が連続している場合に含まれます。
モデリング フラグ: 不足値などの処理方法を示す列挙体。 モデリング フラグはマイニング モデルに対して定義することもできますが、モデル フラグは構造列に使用されるフラグとは異なります。
バインド: ソース データを指定するプロパティ。
サードパーティのアルゴリズムには、マイニング構造列で定義できるカスタム プロパティが含まれている場合があります。
データ マイニング構造とデータ マイニング モデルの詳細については、「マイニング構造 (Analysis Services - データ マイニング)」を参照してください。
関連コンテンツ
マイニング構造列を定義および使用する方法の詳細については、次のトピックを参照してください。
トピック |
リンク |
---|---|
マイニング構造列の定義に使用できるデータ型について説明します。 |
|
マイニング構造列に含まれるデータのそれぞれの型に対して使用できるコンテンツの種類について説明します。 コンテンツの種類はデータ型に依存します。 コンテンツの種類はモデル レベルで割り当てられ、モデルで列データを使用する方法を決定します。 |
|
入れ子になったテーブルの概念を紹介し、入れ子になったテーブルをマイニング構造列としてデータ ソースに追加する方法について説明します。 |
|
予想される列の値の分布を指定するためにマイニング構造列に設定できる分布プロパティについて説明します。 |
|
分離 (ビン分割と呼ばれることもあります) の概念について説明し、連続する数値データを分離するために Analysis Services に用意されている方法について説明します。 |
|
マイニング構造列に設定できるモデリング フラグについて説明します。 |
|
マイニング構造列どうしを関連付けるために使用できる特殊な列である分類済みの列について説明します。 |
|
マイニング構造列を追加および変更する方法について説明します。 |