列の分布 (データ マイニング)
適用対象:SQL Server 2019 以前の Analysis Services Azure Analysis Services Fabric/Power BI Premium
重要
データ マイニングは SQL Server 2017 Analysis Services で非推奨となり、SQL Server 2022 Analysis Services で停止されました。 非推奨および停止された機能については、ドキュメントの更新は行われません。 詳細については、「Analysis Services 下位互換性」を参照してください。
Microsoft SQL Server SQL Server Analysis Services では、マイニング構造で列の分布を定義して、マイニング モデルの作成時にそれらの列のデータをアルゴリズムで処理する方法に影響を与えることができます。 いくつかのアルゴリズムは、列が値の一般的な分布を含むことが認識された場合、モデルを処理する前にすべての連続列の分布を定義するために使用されます。 分布が定義されない場合、アルゴリズムが持つデータを解釈するための情報が少ないため、分布が定義されたときよりも、マイニング モデルの結果が実際の予測より小さくなる場合があります。
SQL Server Analysis Servicesで使用できるアルゴリズムでは、次の分散の種類がサポートされています。
標準
連続列の値は、正規分布のヒストグラムを形成します。
Log Normal
連続列の値は、曲線が上端で長くなり、下端に向かってスキューされるヒストグラムを形成します。
Uniform
連続列の値はフラット曲線を形成し、すべての値が等しくなります。
SQL Server Analysis Services提供されるアルゴリズムの詳細については、「データ マイニング アルゴリズム (Analysis Services - データ マイニング)」を参照してください。
参照
コンテンツの種類 (データ マイニング)
マイニング構造 (Analysis Services - データ マイニング)
分離メソッド (データ マイニング)
分布 (DMX)
マイニング構造列