中间数据挖掘教程 (Analysis Services - 数据挖掘)

Microsoft Analysis Services 提供了用于创建和使用数据挖掘模型的集成环境。 可以轻松地绑定到数据源,在同一数据上创建和测试多个模型,并部署模型以用于预测分析。

在基本数据挖掘教程中,你学习了如何使用 SQL Server Data Tools (SSDT) 创建数据挖掘解决方案,并构建了三个模型,以支持目标邮件市场活动,以分析客户购买行为和面向潜在买家。

此中间教程基于该体验并引入了多个新方案,包括预测和市场篮分析等常见业务要求。 你将了解如何创建时序模型、关联模型和序列聚类分析模型。 最后,你将了解如何使用神经网络来探索数据相关性,以及如何使用逻辑回归进行预测。

课程是独立的,可以单独完成。

若要完成以下教程,应熟悉数据挖掘工具和基本数据挖掘教程中引入的挖掘模型查看器。

所有方案都使用 AdventureWorksDW2012 数据源,但你将为不同的方案创建不同的数据源视图。 只要先创建数据源,就可以按任意顺序执行课程。

课程方案

在目标邮件活动取得成功后,系统会要求你应用数据挖掘知识,以开发多个新模型,以便在业务规划中使用。 其中包括以下任务:

  • 预测: 你将创建一个 时序 模型,以预测世界各地的不同地区的产品销售额。 你将为每个区域开发单个模型,并了解如何使用 交叉预测

  • 市场篮分析: 你将创建 关联模型,以分析访问 Adventure Works Cycles 电子商务网站期间购买的产品分组。 根据此市场篮模型,可以向客户推荐产品。

  • 序列分析: 构建 序列聚类分析模型,以分析客户购买产品的顺序。 根据此模型,可以规划网站设计或新产品/服务的更改。

  • 因素分析: 使用 神经网络 模型来探索呼叫中心数据中服务质量不佳的可能原因。 根据初步模型的见解,你将创建 逻辑回归模型 来预测改善客户体验的策略。

学习内容

本教程介绍如何创建和使用多种类型的数据挖掘算法。 本教程分为以下课程:

第 1 课:创建中间数据挖掘解决方案(中间数据挖掘教程)
在本课中,你将基于 AdventureWorksDW2012 数据库创建新项目,以支持多个新的数据源视图和更多挖掘模型。

第 2 课:构建预测方案(中间数据挖掘教程)
在本课中,你将创建一个挖掘模型,该模型可用作预测方案的一部分。 你还将探索使用Microsoft时序算法生成的挖掘模型。

你将为各个区域生成模型,然后生成可用于交叉预测的常规模型。

第 3 课:构建购物篮分析场景(中级数据挖掘教程)
在本课中,你将添加新的数据源视图,并了解如何使用嵌套表和密钥。 根据此数据,你将创建一个挖掘模型,该模型可用作市场篮方案的一部分。 还将探索使用 Microsoft 关联算法生成的挖掘模型。

第 4 课:构建序列聚类分析方案(中间数据挖掘教程)
在本课中,你将创建一个挖掘模型,该模型可用作序列聚类分析方案的一部分。 你还将了解如何探索使用Microsoft序列聚类分析算法生成的挖掘模型。

第 5 课:构建神经网络和逻辑回归模型(中间数据挖掘教程)
在本课中,你将使用Microsoft神经网络和Microsoft逻辑回归算法创建多个相关的挖掘模型。 你还将了解如何使用数据源视图来浏览模型基础的数据。

要求

请确保已安装以下内容:

  • Microsoft SQL Server 2014

  • Microsoft SQL Server Analysis Services

  • 具有 AdventureWorksDW2012 数据库的 SQL Server。

默认情况下,不会安装示例数据库,以提高安全性。 若要安装 Microsoft SQL Server 的官方数据库,请访问 Microsoft SQL 示例数据库 页并选择相应的示例数据库版本。

另请参阅

基本数据挖掘教程
自行车买家 DMX 教程
市场商品组合 DMX 教程