测试筛选后的模型(数据挖掘基础教程)

由于已确定 TM_Decision_Tree 模型是最准确的,因此,您应该在 Adventure Works Cycles 目标邮递活动的上下文中对该模型进行评估。 Adventure Works Cycles 市场部希望了解男式自行车购买者和女式自行车购买者的特征是否存在差异。 这些信息将帮助他们决定使用哪些杂志进行广告宣传,以及在邮件中推广哪些产品。

在本课程中,您将创建一个按性别筛选的模型。 随后,您即可以方便地创建该模型的副本,而且只需更改筛选条件即可基于不同的性别生成新模型。

有关筛选器的详细信息,请参阅挖掘模型的筛选器(Analysis Services - 数据挖掘)

使用筛选器

通过筛选,您可以轻松地创建基于数据子集生成的模型。 筛选器只应用于该模型,而且不会更改基础数据源。 有关如何将筛选器应用于嵌套表的信息,请参阅数据挖掘中级教程(Analysis Services - 数据挖掘)

事例表的筛选器

首先,您将复制 TM_Decision_Tree 模型。

复制决策树模型

  1. 在 SQL Server Data Tools (SSDT) 中,在解决方案资源管理器中选择 BasicDataMining

  2. 单击**“挖掘模型”**选项卡。

  3. 右键单击 TM_Decision_Tree 模型,然后选择**“新建挖掘模型”**。

  4. 在**“模型名称”**字段中,键入 TM_Decision_Tree_Male。

  5. 单击**“确定”**。

然后为模型创建一个筛选器,用于根据客户的性别选择客户。

创建挖掘模型的事例筛选器

  1. 右键单击 TM_Decision_Tree_Male 挖掘模型以打开快捷菜单。

    - 或 -

    选择该模型。 在**“挖掘模型”菜单上,选择“设置模型筛选器”**。

  2. 在**“模型筛选器”对话框的“挖掘结构列”**文本框中,单击网格中的第一行。

    下拉列表只显示该表中列的名称。

  3. 在“挖掘结构列”文本框中,选择**“性别”**。

    文本框左侧的图标会发生改变,以指示所选项是表还是列。

  4. 单击**“运算符”**文本框,并从列表中选择等于 (=) 运算符。

  5. 单击**“值”**文本框,然后键入 M。

  6. 单击网格中的下一行。

  7. 单击**“确定”关闭“模型筛选器”**对话框。

    筛选器显示在**“属性”窗口中。 或者,您也可以从“属性”窗口启动“模型筛选器”**对话框。

  8. 重复上述步骤,但这次应将模型命名为 TM_Decision_Tree_Female,并在**“值”**文本框中键入 F。

现在,**“挖掘模型”**选项卡中会显示两个新模型。

处理筛选后的模型

模型经过部署和处理后才能使用。 有关处理模型的详细信息,请参阅处理 Targeted Mailing 结构中的模型(数据挖掘基础教程)

处理筛选后的模型

  1. 右键单击 TM_Decision_Tree_Male 模型,并选择**“处理挖掘结构和所有模型”**

  2. 单击**“运行”**以处理新模型。

  3. 处理完成后,在两个处理窗口上单击**“关闭”**。

评估结果

查看结果并评估筛选后的模型的准确性,与您对前三个模型的操作非常相似。 有关详细信息,请参阅:

浏览决策树模型(数据挖掘基础教程)

测试提升图的准确性(数据挖掘基础教程)

浏览筛选后的模型

  1. 在**“数据挖掘设计器”中,选择“挖掘模型查看器”**选项卡。

  2. 在“挖掘模型”框中,选择 TM_Decision_Tree_Male。

  3. 将**“显示级别”**滑块滑动到 3。

  4. 将**“背景”**值更改为 1。

  5. 将光标置于标记为**“全部”**的节点上,以查看自行车购买者和非自行车购买者的数量。

  6. 对 TM_Decision_Tree_Female 重复步骤 1 – 5。

  7. 浏览 TM_Decision_Tree 和按性别筛选模型的结果。 与所有自行车购买者相比,男性和女性自行车购买者与未经筛选自行车购买者具有一些相同特征,但所有这三个群体也存在一些重要差异。 这是非常有用的信息,Adventure Works Cycles 可以利用这些信息来制定他们的营销战略。

测试筛选后的模型的提升

  1. 切换到 SQL Server Data Tools (SSDT) 中的数据挖掘设计器的**“挖掘准确性图表”选项卡,并选择“输入选择”**选项卡。

  2. 在**“选择要用于准确性图表的数据集”组框中,选择“使用挖掘结构测试事例”**。

  3. 在数据挖掘设计器的**“输入选择”选项卡上,在“选择要在提升图中显示的可预测的挖掘模型列”下选中“同步预测列和值”**复选框。

  4. 在**“可预测列名称”**列中,确认为每个模型都选择了 Bike Buyer

  5. 在**“显示”**列中,选择每个模型。

  6. 在**“预测值”**列中,选择 1

  7. 选择**“提升图”**选项卡以显示提升图。

    您现在会注意到,所有三个决策树模型与随机推测模型相比都有了显著提升,而且表现还超过了聚类分析和 Naive-Bayes 模型。

课程中的前一个任务

测试提升图的准确性(数据挖掘基础教程)

下一课

第 6 课:创建和使用预测(数据挖掘基础教程)

请参阅

任务

从挖掘模型中删除筛选器

概念

数据挖掘中级教程(Analysis Services - 数据挖掘)

挖掘模型的筛选器(Analysis Services - 数据挖掘)

其他资源

挖掘模型任务和操作指南