基本数据挖掘教程

欢迎使用 Microsoft Analysis Services 基本数据挖掘教程。 Microsoft SQL Server 提供了用于创建数据挖掘模型和进行预测的集成环境。 在本教程中,你将完成目标邮件市场活动的方案,在该活动中,你将使用机器学习分析和预测客户购买行为。 本教程演示如何使用三种最重要的数据挖掘算法:聚类分析、决策树和 Naive Bayes。 你还将了解如何使用挖掘模型查看器分析结果,以及如何使用Microsoft SQL Server Analysis Services 中包含的数据挖掘工具创建预测和准确性图表。 虚构的公司 Adventure Works Cycles 用于所有示例。

当您熟练使用数据挖掘工具后,我们建议您完成中级数据挖掘教程(Analysis Services - 数据挖掘)。 这些课程演示如何使用预测、市场篮分析、时序、关联模型、嵌套表和顺序聚类分析。

教程方案

在本教程中,你是 Adventure Works Cycles 的员工,该员工负责根据历史购买了解有关公司客户的详细信息,然后使用该历史数据进行可用于营销的预测。 公司以前从未进行过数据挖掘,因此必须专门为数据挖掘创建新的数据库,并设置多个数据挖掘模型。

学习内容

本教程介绍如何创建和使用多种不同类型的机器学习方法。 你还将了解如何创建挖掘模型的副本,并将筛选器应用于输入数据以获取不同的结果。 之后,您可以使用提升图比较这两个模型的结果。 最后,你将使用穿透分析从底层挖掘结构中检索到更多的数据。

Microsoft Analysis Services 数据挖掘包括以下功能,可帮助你轻松开发和比较多个预测模型,然后对结果执行作:

  • 保留验证集 -创建数据挖掘结构时,可以将数据挖掘结构中的数据划分为训练集和测试集。 这样,便可以针对类似的数据集测试模型,并比较相关模型的准确性。

  • 挖掘模型筛选器 -现在可以将筛选器附加到挖掘模型,并在训练和测试期间应用筛选器。 这样就可以轻松地基于不同数据子集生成相关模型。

  • 钻取到结构事例和结构列 - 现在可以轻松地从挖掘模型中的常规模式深入到数据源中的可操作的详细信息。

本教程分为以下课程:

第 1 课:准备 Analysis Services 数据库(基本数据挖掘教程)
在本课中,你将了解如何创建新的 Analysis Services 数据库、添加数据源和数据源视图,以及准备要用于数据挖掘的新数据库。

第 2 课:构建目标邮件结构(基本数据挖掘教程)
在本课中,你将了解如何创建可用作目标邮件方案的一部分的挖掘模型结构。

第 3 课:添加和处理模型
在本课中,你将了解如何向结构添加模型。 你创建的模型是使用以下算法生成的:

  • Microsoft决策树

  • Microsoft集群

  • Microsoft Naive Bayes

第 4 课:探索目标邮件模型(基本数据挖掘教程)
在本课中,你将了解如何使用查看器浏览和解释每个模型的发现。

第 5 课:测试模型(基本数据挖掘教程)
在本课中,你将创建一个目标邮件模型的副本,添加挖掘模型筛选器以将训练数据限制为一组特定的客户,然后评估模型的可行性。

第 6 课:创建和使用预测(基本数据挖掘教程)
在基本数据挖掘教程的最后一课中,你将使用模型来预测哪些客户最有可能购买自行车。 然后,你深入研究潜在案例以获取联系信息。

要求

请确保已安装以下内容:

  • Microsoft SQL Server 2014

  • 以多维模式运行的 Microsoft SQL Server Analysis Services

  • AdventureWorksDW2012 数据库。

为了增强安全性,示例数据库未随 SQL Server 一起安装。 若要安装 Microsoft SQL Server 的官方数据库,请访问 Microsoft SQL 示例数据库 页并选择 SQL Server 2014。

注释

在学习教程时,如果在文档查看器工具栏中添加 “下一个主题 ”和 “上一主题 ”按钮,在步骤之间来回移动可能会更容易。

另请参阅

数据挖掘解决方案
挖掘模型任务和操作指南
使用 DMX 创建和查询数据挖掘模型:教程(Analysis Services - 数据挖掘)