列の分布 (データマイニング)

[アーティクル]
12/23/2023

適用対象:SQL Server 2019 以前の Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

データマイニングは SQL Server 2017 Analysis Services で非推奨となり、SQL Server 2022 Analysis Services で停止されました。非推奨および停止された機能については、ドキュメントの更新は行われません。詳細については、「Analysis Services 下位互換性」を参照してください。

Microsoft SQL Server SQL Server Analysis Services では、マイニング構造で列の分布を定義して、マイニングモデルの作成時にそれらの列のデータをアルゴリズムで処理する方法に影響を与えることができます。いくつかのアルゴリズムは、列が値の一般的な分布を含むことが認識された場合、モデルを処理する前にすべての連続列の分布を定義するために使用されます。分布が定義されない場合、アルゴリズムが持つデータを解釈するための情報が少ないため、分布が定義されたときよりも、マイニングモデルの結果が実際の予測より小さくなる場合があります。

SQL Server Analysis Servicesで使用できるアルゴリズムでは、次の分散の種類がサポートされています。

標準
連続列の値は、正規分布のヒストグラムを形成します。

正規分布を持つヒストグラム正規分布

Log Normal
連続列の値は、曲線が上端で長くなり、下端に向かってスキューされるヒストグラムを形成します。

ログ正規分布を持つヒストグラムログ正規分布

Uniform
連続列の値はフラット曲線を形成し、すべての値が等しくなります。

均一分布を持

SQL Server Analysis Services提供されるアルゴリズムの詳細については、「データマイニングアルゴリズム (Analysis Services - データマイニング)」を参照してください。

参照

コンテンツの種類 (データマイニング)
マイニング構造 (Analysis Services - データマイニング)
分離メソッド (データマイニング)
分布 (DMX)
マイニング構造列

次の方法で共有

列の分布 (データマイニング)

参照

フィードバック

その他のリソース

次の方法で共有

列の分布 (データ マイニング)

参照

フィードバック

その他のリソース

列の分布 (データマイニング)