分布 (DMX)
MicrosoftSQL ServerAnalysis Services では、マイニング モデルを作成するときにアルゴリズムがこれらの列内のデータを処理する方法に影響する、マイニング構造の列のコンテンツを定義できます。いくつかのアルゴリズムは、列が値の一般的な分布を含むことが認識された場合、モデルを処理する前にすべての連続列の分布を定義するために使用されます。分布が定義されない場合、アルゴリズムが持つデータを解釈するための情報が少ないため、分布が定義されたときよりも、マイニング モデルの結果が実際の予測より小さくなる場合があります。
Microsoft データ マイニング アルゴリズムは、次の分布の種類をサポートします。
NORMAL
連続列の値は、正規のガウス分布によるヒストグラムを形成します。Log Normal
連続列の値は、値の対数が正規分布であるヒストグラムを形成します。UNIFORM
連続列の値はフラット曲線を形成し、すべての値が等しくなります。
Microsoft データ マイニング アルゴリズムの詳細については、「データ マイニング アルゴリズム (Analysis Services - データ マイニング)」を参照してください。サードパーティのアルゴリズム プロバイダは、追加の分布の種類をサポートしている場合があります。アルゴリズムがサポートする分布の種類を判断するには、SUPPORTED_DISTRIBUTION_FLAGS スキーマ行セットを使用します。
分布の種類の詳細については、「列の分布 (データ マイニング)」を参照してください。