更改挖掘模型中列的离散化
Analysis Services 在某些情况下会自动离散化值,也就是说,它会在数字列中保存值。 例如,如果数据包含连续数值数据,并且创建了决策树模型,则将依据数据的分布,自动将连续数据的所有列都存入 bin 目录中。 如果要控制数据的离散化方式,则必须更改挖掘结构列的属性,这些属性可控制数据在模型中的使用方式。
有关如何在挖掘模型中设置属性的常规信息,请参阅挖掘模型列。
显示挖掘模型列的属性
在数据挖掘设计器的**“挖掘模型”选项卡中,右键单击包含挖掘模型名称的列标题,或者网格中包含挖掘算法名称的行,然后选择“属性”**。
**“属性”**窗口将显示与挖掘模型相关联的所有属性。
在靠近屏幕左侧的**“结构”**列中,单击包含要离散化的连续数值数据的列。
**“属性”**窗口更改为只显示与该列相关联的属性。
更改离散化方法
在**“挖掘属性”窗口中,单击“内容”**旁的文本框,然后从下拉列表中选择 Discretized。
DiscretizationBucketCount 和 DiscretizationMethod 属性均处于启用状态。
在**“属性”**窗口中,单击 DiscretizationMethod 旁的文本框,然后选择下列值之一:Automatic、EqualAreas 或 Cluster。
注意 如果将列的用法设置为 Ignore,则列的“属性”窗口将为空白。
在设计器中选择一个不同的元素后,新值即生效。
在**“属性”**窗口,单击 DiscretizationBucketCount 旁的文本框,然后键入一个数值。
注意 如果更改这些属性,则必须重新处理该结构以及要对其使用新设置的所有模型。