Microsoft逻辑回归算法

逻辑回归是一种已知的统计技术,用于对二进制结果进行建模。

使用不同的学习技术,在统计研究中,逻辑回归有多种实现。 Microsoft逻辑回归算法是使用Microsoft神经网络算法的变体实现的。 此算法共享神经网络的许多品质,但更易于训练。

逻辑回归的一个优点是,算法高度灵活,采用任何类型的输入,并支持多种不同的分析任务:

  • 使用人口统计来预测结果,例如特定疾病的风险。

  • 探索并加权导致结果的因素。 例如,找到影响客户对商店进行重复访问的因素。

  • 对具有许多属性的文档、电子邮件或其他对象进行分类。

示例:

考虑一组具有相似人口统计信息并从 Adventure Works 公司购买产品的人员。 通过对与特定结果(例如购买目标产品)相关的数据建模,可以查看人口统计信息如何促成某人购买目标产品的可能性。

算法的工作原理

逻辑回归是一种已知的统计方法,用于确定多个因素对结果的贡献。 Microsoft实现使用修改后的神经网络对输入和输出之间的关系进行建模。 测量每个输入对输出的影响,并在完成的模型中加权各种输入。 名称逻辑回归来自使用逻辑转换压缩数据曲线的事实,以尽量减少极端值的影响。 有关实现以及如何自定义算法的详细信息,请参阅 Microsoft逻辑回归算法技术参考

逻辑回归模型所需的数据

准备用于训练逻辑回归模型的数据时,应了解特定算法的要求,包括需要多少数据以及如何使用数据。

逻辑回归模型的要求如下:

单个键列 每个模型必须包含一个唯一标识每个记录的数字或文本列。 不允许使用复合键。

输入列 每个模型必须至少包含一个输入列,其中包含在分析中用作因素的值。 可以根据需要拥有任意数量的输入列,但根据每列中的值数,增加额外列可以增加训练模型所需的时间。

至少一个可预测列 该模型必须至少包含任何数据类型的一个可预测列,包括连续数值数据。 可预测列的值也可以视为模型的输入,也可以指定它仅用于预测。 嵌套表不允许用于可预测列,但可用作输入。

有关逻辑回归模型支持的内容类型和数据类型的更多详细信息,请参阅 Microsoft逻辑回归算法技术参考的“要求”部分。

查看逻辑回归模型

若要浏览模型,可以使用Microsoft神经网络查看器或Microsoft泛型内容树查看器。

使用Microsoft神经网络查看器查看模型时,Analysis Services 会显示导致特定结果的因素,按其重要性进行排名。 可以选择要比较的属性和值。 有关详细信息,请参阅 使用Microsoft神经网络查看器浏览模型

若要了解详细信息,可以使用Microsoft泛型内容树查看器浏览模型详细信息。 逻辑回归模型的模型内容包括一个边际节点,用于显示模型使用的所有输入,以及可预测属性的子网。 有关详细信息,请参阅逻辑回归模型的挖掘模型内容(Analysis Services - 数据挖掘)。

创建预测

训练模型后,可以针对模型内容创建查询以获取回归系数和其他详细信息,也可以使用模型进行预测。

注解

  • 不支持数据钻取功能。 这是因为挖掘模型中的节点结构不一定直接与基础数据相对应。

  • 不支持创建数据挖掘维度。

  • 支持使用 OLAP 挖掘模型。

  • 不支持使用预测模型标记语言(PMML)来创建挖掘模型。

另请参阅

逻辑回归模型的挖掘模型内容(Analysis Services - 数据挖掘)
Microsoft逻辑回归算法技术参考
逻辑回归模型查询示例