次の方法で共有


列の分布 (データ マイニング)

Microsoft SQL Server Analysis Services では、マイニング構造内の列の分布を定義して、マイニング モデルの作成時にこれらの列のデータがアルゴリズムによってどのように処理されるかを指定できます。 いくつかのアルゴリズムは、列が値の一般的な分布を含むことが認識された場合、モデルを処理する前にすべての連続列の分布を定義するために使用されます。 分布を定義しない場合、データを解釈するためのアルゴリズム内の情報は少なくなるので、結果として得られるマイニング モデルによって、分布を定義した場合よりも精度の低い予測が生成される場合があります。

Analysis Services で使用できるアルゴリズムでは、次の分布の種類がサポートされています。

  • Normal
    連続列の値は、正規分布のヒストグラムを形成します。

    正規分布のヒストグラム

  • Log Normal
    連続列の値は、曲線が上端で長くなり、下端に向かってスキューされるヒストグラムを形成します。

    対数正規分布のヒストグラム

  • Uniform
    連続列の値はフラット曲線を形成し、すべての値が等しくなります。

    単一ディストリビューションのヒストグラム

Analysis Services で提供されているアルゴリズムの詳細については、「データ マイニング アルゴリズム (Analysis Services - データ マイニング)」を参照してください。

関連項目

参照

分布 (DMX)

概念

コンテンツの種類 (データ マイニング)

マイニング構造 (Analysis Services - データ マイニング)

分離メソッド (データ マイニング)

マイニング構造列