列の分布 (データ マイニング)
Microsoft SQL Server Analysis Servicesでは、マイニング構造で列の分布を定義して、マイニング モデルを作成するときにアルゴリズムによってそれらの列のデータがどのように処理されるかに影響を与えることができます。 いくつかのアルゴリズムは、列が値の一般的な分布を含むことが認識された場合、モデルを処理する前にすべての連続列の分布を定義するために使用されます。 分布が定義されない場合、アルゴリズムが持つデータを解釈するための情報が少ないため、分布が定義されたときよりも、マイニング モデルの結果が実際の予測より小さくなる場合があります。
Analysis Services で使用できるアルゴリズムでは、次のディストリビューションの種類がサポートされています。
Normal
連続列の値は、正規分布を持つヒストグラムを形成します。
Log Normal
連続列の値はヒストグラムを形成し、曲線は上端で細長く、下端に向かって傾斜します。
Uniform
連続列の値はフラットな曲線を形成し、すべての値が等しい可能性があります。
Analysis Services が提供するアルゴリズムの詳細については、「 データ マイニング アルゴリズム (Analysis Services - データ マイニング)」を参照してください。
参照
コンテンツ タイプ (データ マイニング)マイニング構造 (Analysis Services - データ マイニング)分離メソッド (データ マイニング)ディストリビューション (DMX)マイニング構造列