更改挖掘模型中列的离散化

项目
06/13/2017

Analysis Services 会自动离散化值，也就是说，在某些方案中，它会将数据分装在数值列中。例如，如果数据包含连续数值数据，并且创建了决策树模型，则将依据数据的分布，自动将连续数据的所有列都存入 bin 目录中。如果要控制数据的离散化方式，则必须更改挖掘结构列的属性，这些属性可控制数据在模型中的使用方式。

有关如何在挖掘模型中设置属性的常规信息，请参阅挖掘模型列。

显示挖掘模型列的属性

在数据挖掘设计器的“挖掘模型”选项卡中，右键单击包含挖掘模型名称的列标题，或者网格中包含挖掘算法名称的行，然后选择“属性”。

“属性” 窗口将显示与挖掘模型相关联的所有属性。
在靠近屏幕左侧的 “结构” 列中，单击包含要离散化的连续数值数据的列。

“属性” 窗口更改为只显示与该列相关联的属性。

更改离散化方法

在“ 挖掘属性” 窗口中，单击“ 内容”旁边的文本框，然后 Discretized 从下拉列表中选择。

DiscretizationBucketCount 和 DiscretizationMethod 属性均处于启用状态。
在 “属性” 窗口中，单击旁边的 DiscretizationMethod 文本框并选择以下值之一： Automatic、 EqualAreas或 Cluster。

注意

如果列用法设置为 Ignore，则列的 “属性” 窗口为空。

在设计器中选择一个不同的元素后，新值即生效。
在 “属性” 窗口中，单击旁边的 DiscretizationBucketCount 文本框并键入数值。

注意

如果更改这些属性，则必须重新处理该结构以及要对其使用新设置的所有模型。

另请参阅

挖掘模型任务和操作指南

通过

更改挖掘模型中列的离散化

显示挖掘模型列的属性

更改离散化方法

另请参阅

其他资源