Microsoft逻辑回归算法

逻辑回归是一种已知的统计技术，用于对二进制结果进行建模。

使用不同的学习技术，在统计研究中，逻辑回归有多种实现。 Microsoft逻辑回归算法是使用Microsoft神经网络算法的变体实现的。此算法共享神经网络的许多品质，但更易于训练。

逻辑回归的一个优点是，算法高度灵活，采用任何类型的输入，并支持多种不同的分析任务：

使用人口统计来预测结果，例如特定疾病的风险。
探索并加权导致结果的因素。例如，找到影响客户对商店进行重复访问的因素。
对具有许多属性的文档、电子邮件或其他对象进行分类。

示例：

考虑一组具有相似人口统计信息并从 Adventure Works 公司购买产品的人员。通过对与特定结果（例如购买目标产品）相关的数据建模，可以查看人口统计信息如何促成某人购买目标产品的可能性。

算法的工作原理

逻辑回归是一种已知的统计方法，用于确定多个因素对结果的贡献。 Microsoft实现使用修改后的神经网络对输入和输出之间的关系进行建模。测量每个输入对输出的影响，并在完成的模型中加权各种输入。名称逻辑回归来自使用逻辑转换压缩数据曲线的事实，以尽量减少极端值的影响。有关实现以及如何自定义算法的详细信息，请参阅 Microsoft逻辑回归算法技术参考。

逻辑回归模型所需的数据

准备用于训练逻辑回归模型的数据时，应了解特定算法的要求，包括需要多少数据以及如何使用数据。

逻辑回归模型的要求如下：

单个键列 每个模型必须包含一个唯一标识每个记录的数字或文本列。不允许使用复合键。

输入列 每个模型必须至少包含一个输入列，其中包含在分析中用作因素的值。可以根据需要拥有任意数量的输入列，但根据每列中的值数，增加额外列可以增加训练模型所需的时间。

至少一个可预测列 该模型必须至少包含任何数据类型的一个可预测列，包括连续数值数据。可预测列的值也可以视为模型的输入，也可以指定它仅用于预测。嵌套表不允许用于可预测列，但可用作输入。

有关逻辑回归模型支持的内容类型和数据类型的更多详细信息，请参阅 Microsoft逻辑回归算法技术参考的“要求”部分。

查看逻辑回归模型

若要浏览模型，可以使用Microsoft神经网络查看器或Microsoft泛型内容树查看器。

使用Microsoft神经网络查看器查看模型时，Analysis Services 会显示导致特定结果的因素，按其重要性进行排名。可以选择要比较的属性和值。有关详细信息，请参阅使用Microsoft神经网络查看器浏览模型。

若要了解详细信息，可以使用Microsoft泛型内容树查看器浏览模型详细信息。逻辑回归模型的模型内容包括一个边际节点，用于显示模型使用的所有输入，以及可预测属性的子网。有关详细信息，请参阅逻辑回归模型的挖掘模型内容（Analysis Services - 数据挖掘）。

创建预测

训练模型后，可以针对模型内容创建查询以获取回归系数和其他详细信息，也可以使用模型进行预测。

有关如何针对数据挖掘模型创建查询的一般信息，请参阅数据挖掘查询。
有关逻辑回归模型查询的示例，请参阅聚类分析模型查询示例。

注解

不支持数据钻取功能。这是因为挖掘模型中的节点结构不一定直接与基础数据相对应。
不支持创建数据挖掘维度。
支持使用 OLAP 挖掘模型。
不支持使用预测模型标记语言（PMML）来创建挖掘模型。

另请参阅

逻辑回归模型的挖掘模型内容（Analysis Services - 数据挖掘）
Microsoft逻辑回归算法技术参考
 逻辑回归模型查询示例

Last updated on 2017-06-13

通过