创建市场篮结构和模型(数据挖掘中级教程)

您已创建了一个数据源视图,现在将使用数据挖掘向导创建一个新的挖掘结构。 在本任务中,将创建基于 Microsoft 关联算法的挖掘结构和挖掘模型。

注意注意

如果遇到说明 vAssocSeqLineItems 不能用作嵌套表的错误,请返回本课中的前一个任务,并确保通过从 vAssocSeqLineItems 表(多端)拖到 vAssocSeqOrders 表(一端)来创建多对一联接。 还可以通过右键单击联接线来编辑这两个表之间的关系。

创建关联挖掘结构

  1. 在 SQL Server Data Tools (SSDT) 的解决方案资源管理器中,右键单击**“挖掘结构”,再选择“新建挖掘结构”**以打开数据挖掘向导。

  2. 在**“欢迎使用数据挖掘向导”页上,单击“下一步”**。

  3. 在**“选择定义方法”页上,确保已选中“从现有关系数据库或数据仓库”,再单击“下一步”**。

  4. 在**“创建数据挖掘结构”页的“您要使用何种数据挖掘技术?”下,选中列表中的“Microsoft 关联规则”,再单击“下一步”**。 **“选择数据源视图”**页随即显示。

  5. 在**“可用数据源视图”下选择“Orders”,再单击“下一步”**。

  6. 在**“指定表类型”页上,在 vAssocSeqLineItems 表的对应行中选中“嵌套”复选框,在嵌套表 vAssocSeqOrders 的对应行中选中“事例”复选框。 单击“下一步”**。

  7. 在**“指定定型数据”页中,清除任何可能处于选中状态的复选框。 通过选中 OrderNumber 旁边的“键”**复选框,为事例表 vAssocSeqOrders 设置键。

    由于市场篮分析的目的在于确定单个交易中包括哪些产品,因此您不必使用 CustomerKey 字段,

  8. 通过选中 Model 旁边的**“键”复选框,为嵌套表 vAssocSeqLineItems 设置键。 在这样做之后,将会自动选中“输入”复选框。 对于“模型”也选中“可预测”**复选框。

    在市场篮模型中,您不关心产品在购物篮中的顺序,因此,您不应当将 LineNumber 用作嵌套表的键, 仅在顺序非常重要的模型中才将 LineNumber 用作键。 您将在第 4 课中创建使用 Microsoft 顺序分析和聚类分析算法的模型。

  9. 选中 IncomeGroup 和 Region 左侧的复选框,但不选择任何其他内容。 选中最左侧的列会将这些列添加到结构中以供日后参考,但不会用在模型中。 您选择的内容应如下所示:

    对话框外观如何

  10. 单击**“下一步”**。

  11. 在**“指定列的内容和数据类型”页上,查看您选择的内容(应如下表所示),再单击“下一步”**。

    内容类型

    数据类型

    IncomeGroup

    离散

    Text

    Order Number

    Text

    Region

    离散

    Text

    vAssocSeqLineItems

      

      

    Model

    Text

  12. 在**“创建测试集”页上,“测试数据百分比”选项的默认值为 30%。 请将该选项更改为 0。 单击“下一步”**。

    注意注意

    Analysis Services 为测量模型精确度提供不同的图表。 但是,某些精确度图表类型(如提升图和交叉验证报告)旨在进行分类和估计。 关联预测不支持这些方法。

  13. 在**“完成向导”页的“挖掘结构名称”**中,键入 Association。

  14. 在**“挖掘模型名称”**中,键入 Association。

  15. 选择**“允许钻取”选项,然后单击“完成”**。

    系统将打开数据挖掘设计器,显示刚刚创建的 Association 挖掘结构。

课程中的下一个任务

修改和处理市场篮模型(数据挖掘中级教程)

请参阅

概念

Microsoft 关联算法

内容类型(数据挖掘)