市场篮 DMX 教程
新建日期: 2005 年 12 月 5 日
在本教程中,您将学习如何使用数据挖掘扩展插件 (DMX) 查询语言来创建、定型和浏览挖掘模型。然后,您将使用这些挖掘模型创建预测,说明可能同时购买的产品。
挖掘模型将使用 AdventureWorksDW 示例数据库(存储虚构公司 Adventure Works Cycles 的数据)中所包含的数据创建。Adventure Works Cycles 是大型跨国制造公司。公司生产金属和复合材料的自行车,产品远销北美、欧洲和亚洲市场。公司总部设在华盛顿州的伯瑟尔市,拥有 290 名雇员,而且拥有多个活跃在世界各地的地区性销售团队。有关 AdventureWorksDW 示例数据库的详细信息,请参阅 AdventureWorks 示例数据仓库。
教程方案
Adventure Works Cycles 决定创建使用数据挖掘功能的自定义应用程序来预测其客户想要同时购买的产品类型。该自定义应用程序的目的是指定一组产品,并预测另外还有哪些产品将与指定的产品一同被购买。然后,Adventure Works Cycles 将使用此信息在其网站中添加建议功能,并更好地组织向客户提供信息的方式。
Microsoft SQL Server 2005 Analysis Services (SSAS) 提供了多个可用于完成此任务的工具:
- DMX 查询语言
- Microsoft 关联算法
- SQL Server Management Studio 中的查询编辑器
数据挖掘扩展插件 (DMX) 是 Analysis Services 提供的一种查询语言,可以使用它来创建和处理挖掘模型。Microsoft 关联算法创建可以预测将同时被购买的产品的模型。
本教程的目的是提供将在自定义应用程序中使用的 DMX 查询。
有关详细信息,请参阅使用数据挖掘
挖掘结构和挖掘模型
开始创建 DMX 语句之前,了解 Analysis Services 用来创建挖掘模型的主要对象十分重要。挖掘结构是一种数据结构,它定义生成挖掘模型的数据域。单个挖掘结构可以包含多个共享相同域的挖掘模型。挖掘模型可向挖掘结构所代表的数据应用挖掘模型算法。
挖掘结构的生成块是挖掘结构列,它对数据源包含的数据进行说明。这些列包含诸如数据类型、内容类型以及数据分发方式等信息。
挖掘模型必须包含挖掘结构中所述的键列,以及其余列的子集。挖掘模型定义每个列的用法以及用于创建挖掘模型的算法。例如,在 DMX 中,您可以将一列指定为键列或 PREDICT 列。如果有一列未指定,则会将该列假定为一个输入列。
在 DMX 中,有两种创建挖掘模型的方式。您可以使用 CREATE MINING MODEL 语句同时创建挖掘结构以及关联的挖掘模型,也可以首先使用 CREATE MINING STRUCTURE 语句创建挖掘结构,然后使用 ALTER STRUCTURE 语句向结构中添加挖掘模型。下面将介绍这几种方法。
CREATE MINING MODEL
使用此语句可以创建挖掘结构以及关联的同名挖掘模型。挖掘模型名称后追加有“Structure”,以便与挖掘结构区分开。如果要创建包含单一挖掘模型的挖掘结构,则此语句将非常有用。有关详细信息,请参阅 CREATE MINING MODEL (DMX)。
ALTER MINING STRUCTURE
使用此语句可以向服务器中已存在的挖掘结构中添加挖掘模型。如果要创建包含多个不同挖掘模型的挖掘结构,则此语句将非常有用。由于各种原因,您可能需要在单一挖掘结构中添加多个挖掘模型。例如,可以使用不同的算法创建多个挖掘模型以判断哪种方法效果最佳。可以使用相同的算法创建多个挖掘模型,但通过将每一个挖掘模型中的一个参数设置为不同的值来查找最佳参数设置。有关详细信息,请参阅 ALTER MINING STRUCTURE (DMX)。
因为您将创建包含多个挖掘模型的挖掘结构,因此使用本教程中的第二种方法。
有关详细信息
数据挖掘扩展插件 (DMX) 参考, 了解 Select 语句 (DMX), 预测查询 (DMX)
学习内容
本教程分为以下几课:
- 第 1 课:创建市场篮挖掘模型
在本课中,您将学习如何使用 CREATE 语句创建挖掘结构。
- 第 2 课:向市场篮挖掘结构中添加挖掘模型
在本课中,您将学习如何使用 ALTER 语句向挖掘结构中添加挖掘模型。
- 第 3 课:处理市场篮挖掘结构
在本课中,您将学习如何使用 INSERT INTO 语句处理挖掘结构及其关联的挖掘模型。
- 第 4 课:执行市场篮预测
在本课中,您将学习如何使用 PREDICTION JOIN 语句根据挖掘模型创建预测。
要求
执行本教程前,请确保安装了下列各项:
- Microsoft SQL Server 2005
- Microsoft SQL Server 2005 Analysis Services (SSAS)
- AdventureWorks 数据库,该数据库随 SQL Server 2005 一起提供。为了增强安全性,默认情况下将不安装该示例数据库。有关安装示例数据库的详细信息,请参阅运行安装程序安装 AdventureWorks 示例数据库和示例。
注意: |
---|
阅读教程时,建议您将“下一个主题”按钮和“上一个主题”按钮添加到文档查看器工具栏中。有关详细信息,请参阅向帮助中添加“上一步”和“下一步”按钮。 |