创建市场篮结构和模型(数据挖掘中级教程)
适用于: SQL Server 2016 Preview
您已创建了一个数据源视图,现在将使用数据挖掘向导创建一个新的挖掘结构。 在本任务中,将创建基于 Microsoft 关联算法的挖掘结构和挖掘模型。
备注
如果遇到说明 vAssocSeqLineItems 不能用作嵌套表的错误,请返回本课中的前一个任务,并确保通过从 vAssocSeqLineItems 表(多端)拖到 vAssocSeqOrders 表(一端)来创建多对一联接。 还可以通过右键单击联接线来编辑这两个表之间的关系。
创建关联挖掘结构
在解决方案资源管理器中 SQL Server Data Tools (SSDT), ,用鼠标右键单击 挖掘结构 ,然后选择 新建挖掘结构 若要打开数据挖掘向导。
在 “欢迎使用数据挖掘向导” 页上,单击 “下一步”。
在 选择定义方法 页上,确认 从现有关系数据库或数据仓库 已选择,然后单击 下一步。
在 创建数据挖掘结构 页面上,在 您想要使用何种数据挖掘技术?, ,选择 Microsoft 关联规则 从列表中,然后单击 下一步。 选择数据源视图 页将出现。
选择 订单下 可用数据源视图, ,然后单击 下一步。
在 指定表类型 页上,在 vAssocSeqLineItems 表的行中,选择 嵌套 复选框,然后在嵌套的表 vAssocSeqOrders 行中,选择 用例 复选框。 单击“下一步” 。
在 指定定型数据 页上,清除任何可能选中的框。 为设置键事例表 vAssocSeqOrders,选择 密钥 OrderNumber 旁边的复选框。
由于市场篮分析的目的是确定在单个事务中包括哪些产品,因此不需要使用 CustomerKey 字段。
通过设置嵌套表 vAssocSeqLineItems 的键选择 密钥 Model 旁边的复选框。 输入 执行此操作时,将会自动选中复选框。 选择 可预测 复选框 模型 以及。
在市场篮模型中,您不关心的购物篮中产品的序列,因此不应包括 LineNumber 作为嵌套表的键。 将使用 LineNumber 为仅在顺序非常重要的模型中的键。 您将在第 4 课中创建使用 Microsoft 顺序分析和聚类分析算法的模型。
选中 IncomeGroup 和 Region 左侧的复选框,但是不进行任何其他选择。 选中最左侧的列会将这些列添加到结构中以供日后参考,但不会用在模型中。 您选择的内容应如下所示:
单击“下一步” 。
在 指定列内容和数据类型页上,查看所选内容,应将下表中所示,然后单击 下一步。
列 内容类型 数据类型 IncomeGroup 离散 Text Order Number Key Text 地区 离散 Text vAssocSeqLineItems Model Key Text 在 创建测试设置 页上,该选项的默认值 的测试数据百分比 为 30%。 该选项更改为 0。 单击“下一步” 。
备注
Analysis Services 为测量模型精确度提供不同的图表。 但是,某些精确度图表类型(如提升图和交叉验证报告)旨在进行分类和估计。 关联预测不支持这些方法。在 完成向导 页上,在 挖掘结构名称, ,类型 关联。
在 挖掘模型名称, ,类型 关联。
选择选项 允许钻取, ,然后单击 完成。
数据挖掘设计器将打开以显示 关联 刚创建的挖掘结构。