已分类列(数据挖掘)
定义已分类列时,在挖掘结构中创建当前列和另一个列之间的关系。 指定为已分类列的挖掘结构列中的数据包含描述挖掘结构中另一个列的值的分类信息。
例如,假定您有两个包含数值数据的列:其中 [Yearly Purchases] 列包含特定日历年每个客户每年的总购买量,[Standard Deviations] 列则包含这些值的标准偏差。 在此例中,您可以指定 [Yearly Purchases] 列为已分类列,模型将在分析中使用此关系。
注意 |
---|
Analysis Services 中提供的算法不支持使用已分类列,提供此功能是用于创建自定义算法中。 |
定义已分类列
已分类列的数据类型必须为 Long 或 Double。
以下列表说明 Analysis Services 支持的已分类列内容类型。
PROBABILITY
列内的值是相关值的概率,是介于 0 和 1 之间的数字。VARIANCE
列内的值是相关值的方差。STDEV
列内的值是相关值的标准偏差。PROBABILITY_VARIANCE
列内的值是相关值概率的方差。PROBABILITY_STDEV
列内的值是相关值概率的标准偏差。SUPPORT
列内的值是相关值的权重或事例复制因子。