自行车购买者 DMX 教程
更新日期: 2007 年 9 月 15 日
在本教程中,您将学习如何使用数据挖掘扩展插件 (DMX) 查询语言来创建、定型和浏览挖掘模型。 然后,您将使用这些挖掘模型创建预测,确定客户是否将购买自行车。
挖掘模型将使用 AdventureWorksDW 示例数据库(存储虚构公司 Adventure Works Cycles 的数据)中所包含的数据创建。Adventure Works Cycles 是大型跨国制造公司。 公司生产金属和复合材料的自行车,产品远销北美、欧洲和亚洲市场。 公司总部设在华盛顿州的伯瑟尔市,拥有 290 名雇员,而且拥有多个活跃在世界各地的地区性销售团队。 有关 AdventureWorksDW 示例数据库的详细信息,请参阅 AdventureWorks 示例数据仓库。
教程方案
Adventure Works Cycles 已决定通过创建采用数据挖掘功能的自定义应用程序来扩展其数据分析。 自定义应用程序的目的是能够:
- 输入潜在客户的特定特征并预测这些客户是否将购买自行车。
- 输入潜在客户的列表及其特征,并预测哪些客户将购买自行车。
在第一种情况下,客户数据由客户注册页提供;在第二种情况下,潜在客户的列表由 Adventure Works Cycles 市场部提供。
此外,市场部还请求了将现有客户根据各种特征(例如,他们的居住地、孩子个数以及上下班路程)分组到不同类别中。 他们要查看这些群集是否可用于帮助确定特定的客户类型。 这将需要另外的挖掘模型。
Microsoft SQL Server 2005 Analysis Services (SSAS) 提供了多个可用于完成这些任务的工具:
- DMX 查询语言
- Microsoft 决策树算法和 Microsoft 聚类分析算法
- SQL Server Management Studio 中的查询编辑器
数据挖掘扩展插件 (DMX) 是 Analysis Services 提供的一种查询语言,可以使用它来创建和处理挖掘模型。 Microsoft 决策树算法创建的模型可用于预测某人是否将购买自行车。 生成的模型可以将单个客户或客户表作为一个输入。 Microsoft 聚类分析算法可以根据共享特征创建客户分组。 本教程的目的是提供将在自定义应用程序中使用的 DMX 脚本。
有关详细信息,请参阅使用数据挖掘。
挖掘结构和挖掘模型
开始创建 DMX 语句之前,了解 Analysis Services 用来创建挖掘模型的主要对象十分重要。 挖掘结构是一种数据结构,它定义生成挖掘模型的数据域。 单个挖掘结构可以包含多个共享相同域的挖掘模型。 挖掘模型可向挖掘结构所代表的数据应用挖掘模型算法。
挖掘结构的生成块是挖掘结构列,它对数据源包含的数据进行说明。 这些列包含诸如数据类型、内容类型以及数据分发方式等信息。
挖掘模型必须包含挖掘结构中所述的键列,以及其余列的子集。 挖掘模型定义每个列的用法以及用于创建挖掘模型的算法。 例如,在 DMX 中,您可以将一列指定为键列或 PREDICT 列。 如果有一列未指定,则会将该列假定为一个输入列。
在 DMX 中,有两种创建挖掘模型的方式。 您可以使用 CREATE MINING MODEL 语句同时创建挖掘结构以及关联的挖掘模型,也可以首先使用 CREATE MINING STRUCTURE 语句创建挖掘结构,然后使用 ALTER STRUCTURE 语句向结构中添加挖掘模型。 下面将介绍这几种方法。
CREATE MINING MODEL
使用此语句可以创建挖掘结构以及关联的同名挖掘模型。 挖掘模型名称后追加有“Structure”,以便与挖掘结构区分开。 如果要创建包含单一挖掘模型的挖掘结构,则此语句将非常有用。有关详细信息,请参阅 CREATE MINING MODEL (DMX)。
ALTER MINING STRUCTURE
使用此语句可以向服务器中已存在的挖掘结构中添加挖掘模型。 如果要创建包含多个不同挖掘模型的挖掘结构,则此语句将非常有用。 由于各种原因,您可能需要在单一挖掘结构中添加多个挖掘模型。 例如,您可以使用不同算法创建多个挖掘模型以考察哪个模型与您的数据结合使用效果最佳。 可以使用相同的算法创建多个挖掘模型,但通过将每一个挖掘模型中的一个参数设置为不同的值来查找最佳参数设置。有关详细信息,请参阅 ALTER MINING STRUCTURE (DMX)。
因为您将创建包含多个挖掘模型的挖掘结构,因此使用本教程中的第二种方法。
有关详细信息
数据挖掘扩展插件 (DMX) 参考, 了解 Select 语句 (DMX), 预测查询 (DMX)
学习内容
本教程分为以下几课:
- 第 1 课:创建自行车购买者挖掘结构
在本课中,您将学习如何使用 CREATE 语句创建挖掘结构。
- 第 2 课:向自行车购买者挖掘结构添加挖掘模型
在本课中,您将学习如何使用 ALTER 语句向挖掘结构中添加挖掘模型。
- 第 3 课:处理自行车购买者挖掘结构
在本课中,您将学习如何使用 INSERT INTO 语句处理挖掘结构及其关联的挖掘模型。
- 第 4 课:浏览自行车购买者挖掘模型
在本课中,您将学习如何使用 SELECT 语句浏览挖掘模型的内容。
- 第 5 课:执行预测查询
在本课中,您将学习如何使用 PREDICTION JOIN 语句根据挖掘模型创建预测。
要求
执行本教程前,请确保安装了下列各项:
- Microsoft SQL Server 2005
- Microsoft SQL Server 2005 Analysis Services (SSAS)
- AdventureWorks 数据库,该数据库随 SQL Server 2005 一起提供。 为了增强安全性,默认情况下将不安装该示例数据库。 有关安装示例数据库的详细信息,请参阅运行安装程序安装 AdventureWorks 示例数据库和示例。
注意: |
---|
阅读教程时,建议您将“下一个主题”按钮和“上一个主题”按钮添加到文档查看器工具栏中。 有关详细信息,请参阅向帮助中添加“上一步”和“下一步”按钮。 |