分布 (DMX)
适用于: SQL Server Analysis Services
在 Microsoft SQL Server Analysis Services中,可以定义挖掘结构中列的内容,以影响算法在创建挖掘模型时如何处理这些列中的数据。 对于某些算法,如果已知列中包含常用的值分布,则在处理模型之前定义任意连续列的分布将非常有用。 如果不定义分布,则由于算法据以解释数据的信息较少,生成的挖掘模型产生的预测可能不如定义了分布时产生的预测精确。
Microsoft 数据挖掘算法支持以下分布类型:
常规
连续列的值构成一个正态高斯分布直方图。
Log Normal
连续列的值构成一个直方图,其中值的对数呈正态分布。
均匀
连续列的值构成平坦曲线,曲线上的所有值都具有相同概率。
有关 Microsoft 数据挖掘算法的详细信息,请参阅 数据挖掘算法 (Analysis Services - 数据挖掘) 。 第三方算法提供程序可能支持其他分布类型。 若要确定算法支持的分发类型,请使用 SUPPORTED_DISTRIBUTION_FLAGS 架构行集。
有关分布类型的详细信息,请参阅 列分布 (数据挖掘) 。
另请参阅
内容类型(数据挖掘)
数据挖掘扩展插件 (DMX) 参考
数据挖掘扩展插件 (DMX) 语法元素
数据挖掘扩展插件 (DMX) 函数参考
数据挖掘扩展插件 (DMX) 运算符参考
数据挖掘扩展插件 (DMX) 语句参考
数据挖掘扩展插件 (DMX) 语法约定
通用预测函数 (DMX)
DMX 预测查询的结构和用法
了解 DMX Select 语句
反馈
https://aka.ms/ContentUserFeedback。
即将发布:在整个 2024 年,我们将逐步淘汰作为内容反馈机制的“GitHub 问题”,并将其取代为新的反馈系统。 有关详细信息,请参阅:提交和查看相关反馈