市场篮 DMX 教程
在本教程中,您将学习如何使用数据挖掘扩展插件 (DMX) 查询语言来创建、定型和浏览挖掘模型。 然后,您将使用这些挖掘模型创建预测,说明可能同时购买的产品。
挖掘模型将从 AdventureWorksDW2012 示例数据库中包含的数据创建,该数据库存储虚构公司 Adventure Works Cycles 的数据。 Adventure Works Cycles 是一家大型跨国制造公司。 公司生产金属和复合材料的自行车,产品远销北美、欧洲和亚洲市场。 公司总部设在华盛顿州的伯瑟尔市,拥有 290 名雇员,而且拥有多个活跃在世界各地的地区性销售团队。
教程方案
Adventure Works Cycles 决定创建自定义应用程序,该应用程序采用数据挖掘功能来预测其客户倾向于同时购买的产品类型。 该自定义应用程序的目的是能够指定一组产品,并预测另外还有哪些产品将与指定的产品一同购买。 然后,Adventure Works Cycles 将使用此信息向其网站添加“建议”功能,并更好地组织向客户呈现信息的方式。
Microsoft SQL Server Analysis Services 提供了多个可用于完成此任务的工具:
DMX 查询语言
SQL Server Management Studio 中的查询编辑器
数据挖掘扩展插件(DMX)是由 Analysis Services 提供的查询语言,可用于创建和使用挖掘模型。 Microsoft关联算法创建可以预测可能一起购买的产品的模型。
本教程的目的是提供将在自定义应用程序中使用的 DMX 查询。
有关详细信息:数据挖掘解决方案
挖掘结构和挖掘模型
在开始创建 DMX 语句之前,必须了解 Analysis Services 用于创建挖掘模型的主要对象。 挖掘结构是一种数据结构,用于定义从中生成挖掘模型的数据域。 单个挖掘结构可以包含多个 共享同一域的挖掘模型 。 挖掘模型可向挖掘结构所代表的数据应用挖掘模型算法。
挖掘结构的构造块是挖掘结构列,这些列对数据源所包含的数据进行说明。 这些列包含诸如数据类型、内容类型以及数据分发方式等信息。
挖掘模型必须包含挖掘结构中所述的键列,以及其余列的子集。 挖掘模型定义每个列的用法以及用于创建挖掘模型的算法。 例如,在 DMX 中,您可以将一列指定为键列或 PREDICT 列。 如果有一列未指定,则会将该列假定为一个输入列。
在 DMX 中,有两种创建挖掘模型的方式。 您可以使用 CREATE MINING MODEL
语句同时创建挖掘结构以及关联的挖掘模型,也可以首先使用 CREATE MINING STRUCTURE
语句创建挖掘结构,然后使用 ALTER STRUCTURE
语句向结构中添加挖掘模型。 将在下面介绍这些方法。
CREATE MINING MODEL
使用此语句可以创建挖掘结构以及关联的同名挖掘模型。 挖掘模型名称后追加有“Structure”,以便与挖掘结构区分开。
如果要创建包含单一挖掘模型的挖掘结构,则此语句将非常有用。
有关详细信息,请参阅 CREATE MINING MODEL (DMX)。
CREATE MINING STRUCTURE
使用此语句可创建不带任何模型的新挖掘结构。
在使用 CREATE MINING STRUCTURE 时,还可以创建一个维持数据集,使用该数据集可测试任何基于相同挖掘结构的模型。
有关详细信息,请参阅 CREATE MINING STRUCTURE (DMX)。
ALTER MINING STRUCTURE
使用此语句可以向服务器中已存在的挖掘结构中添加挖掘模型。
由于各种原因,您可能需要在单一挖掘结构中添加多个挖掘模型。 例如,可以使用不同的算法创建多个挖掘模型以判断哪种方法效果最佳。 也可以创建使用相同算法的多个挖掘模型,但将每个挖掘模型中的某个参数设置为不同的值来寻找最佳参数设置。
有关详细信息,请参阅 ALTER MINING STRUCTURE (DMX)。
因为您将创建包含多个挖掘模型的挖掘结构,因此使用本教程中的第二种方法。
详细信息
数据挖掘扩展插件 (DMX) 参考, 了解 DMX Select 语句、 DMX 预测查询的结构和用法
学习内容
本教程分为以下几课:
第 1 课:创建市场篮挖掘结构
在本课中,您将学习如何使用 CREATE
语句创建挖掘结构。
第 2 课:向市场篮挖掘结构中添加挖掘模型
在本课中,您将学习如何使用 ALTER
语句向挖掘结构中添加挖掘模型。
第 3 课:处理市场篮挖掘结构
在本课中,您将学习如何使用 INSERT INTO
语句处理挖掘结构及其关联的挖掘模型。
第 4 课:执行市场篮预测
在本课中,您将学习如何使用 PREDICTION JOIN
语句根据挖掘模型创建预测。
要求
执行本教程前,请确保安装了下列各项:
Microsoft SQL Server
Microsoft SQL Server Analysis Services
AdventureWorksDW2012 数据库
为了增强安全性,默认情况下将不安装该示例数据库。 若要安装 Microsoft SQL Server 的官方示例数据库,请转到 https://www.CodePlex.com/MSFTDBProdSamples SQL Server 产品示例Microsoft部分中的Microsoft SQL Server 示例和社区项目主页。 单击“数据库”,然后单击“发布”选项卡,然后选择所需的数据库。
注意
查看教程时,建议将“下一个主题”和“上一主题”按钮添加到文档查看器工具栏。