更改挖掘模型中列的离散化

适用于:SQL Server 2019 及更早版本的 Analysis Services Azure Analysis Services Fabric/Power BI Premium

重要

数据挖掘在 SQL Server 2017 Analysis Services 中已弃用,现在在 SQL Server 2022 Analysis Services 中已停止使用。 对于已弃用和停止使用的功能,文档不会更新。 若要了解详细信息,请参阅 Analysis Services 后向兼容性

SQL Server Analysis Services自动离散化值,也就是说,它在某些方案中将数值列中的数据装箱。 例如,如果数据包含连续数值数据,并且创建了决策树模型,则将依据数据的分布,自动将连续数据的所有列都存入 bin 目录中。 如果要控制数据的离散化方式,则必须更改挖掘结构列的属性,这些属性可控制数据在模型中的使用方式。

有关如何在挖掘模型中设置属性的常规信息,请参阅 挖掘模型列

显示挖掘模型列的属性

  1. 在数据挖掘设计器的“挖掘模型”选项卡中,右键单击包含挖掘模型名称的列标题,或者网格中包含挖掘算法名称的行,然后选择“属性”。

    “属性” 窗口将显示与挖掘模型相关联的所有属性。

  2. 在靠近屏幕左侧的 “结构” 列中,单击包含要离散化的连续数值数据的列。

    “属性” 窗口更改为只显示与该列相关联的属性。

更改离散化方法

  1. “挖掘属性” 窗口中,单击 “内容”旁的文本框,然后从下拉列表中选择 Discretized

    DiscretizationBucketCountDiscretizationMethod 属性均处于启用状态。

  2. “属性” 窗口中,单击旁边的 DiscretizationMethod 文本框并选择以下值之一: AutomaticEqualAreasCluster

    注意

    如果列的用法设置为 Ignore,则列的 “属性” 窗口将为空白。

    在设计器中选择一个不同的元素后,新值即生效。

  3. “属性” 窗口中,单击旁边的 DiscretizationBucketCount 文本框并键入数值。

    注意

    如果更改这些属性,则必须重新处理该结构以及要对其使用新设置的所有模型。

另请参阅

挖掘模型任务和操作指南