次の方法で共有


列の分布 (データ マイニング)

適用対象:SQL Server 2019 以前の Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

データ マイニングは SQL Server 2017 Analysis Services で非推奨となり、SQL Server 2022 Analysis Services で停止されました。 非推奨および停止された機能については、ドキュメントの更新は行われません。 詳細については、「Analysis Services 下位互換性」を参照してください。

Microsoft SQL Server SQL Server Analysis Services では、マイニング構造で列の分布を定義して、マイニング モデルの作成時にそれらの列のデータをアルゴリズムで処理する方法に影響を与えることができます。 いくつかのアルゴリズムは、列が値の一般的な分布を含むことが認識された場合、モデルを処理する前にすべての連続列の分布を定義するために使用されます。 分布が定義されない場合、アルゴリズムが持つデータを解釈するための情報が少ないため、分布が定義されたときよりも、マイニング モデルの結果が実際の予測より小さくなる場合があります。

SQL Server Analysis Servicesで使用できるアルゴリズムでは、次の分散の種類がサポートされています。

標準
連続列の値は、正規分布のヒストグラムを形成します。

正規分布を持つヒストグラム 正規分布

Log Normal
連続列の値は、曲線が上端で長くなり、下端に向かってスキューされるヒストグラムを形成します。

ログ正規分布を持つヒストグラム ログ正規分布

Uniform
連続列の値はフラット曲線を形成し、すべての値が等しくなります。

均一分布を持

SQL Server Analysis Services提供されるアルゴリズムの詳細については、「データ マイニング アルゴリズム (Analysis Services - データ マイニング)」を参照してください。

参照

コンテンツの種類 (データ マイニング)
マイニング構造 (Analysis Services - データ マイニング)
分離メソッド (データ マイニング)
分布 (DMX)
マイニング構造列