测试筛选后的模型(数据挖掘基础教程)

TM_Decision_Tree确定模型最准确后,将自定义模型以更好地满足 Adventure Works Cycles 目标邮件市场活动的需求。 具体来说,市场部希望了解男客户和女客户是否存在特征差异。 这些信息可帮助他们决定使用哪些杂志进行广告宣传,以及在邮件中推广哪些产品。

使用筛选器

通过筛选,您可以轻松地创建基于数据子集生成的模型。 筛选器只应用于该模型,而且不会更改基础数据源。

在本课中,您将创建一个针对性别进行了筛选的模型,以预测男性和女性中对自行车购买行为影响最大的特征。

首先,创建模型的副本 TM_Decision_Tree

复制决策树模型

  1. 在“SQL Server Data Tools (SSDT) ”中,在“解决方案资源管理器”中选择“基本数据”“Mining”。

  2. 单击 “挖掘模型” 选项卡。

  3. 右键单击该 TM_Decision_Tree 模型,然后选择“ 新建挖掘模型”。

  4. “模型名称” 字段中,键入 TM_Decision_Tree_Male

  5. 单击“确定”。

然后为模型创建一个筛选器,用于根据客户的性别选择客户。

创建挖掘模型的事例筛选器

  1. 右键单击 TM_Decision_Tree_Male 挖掘模型以打开快捷菜单。

    \- 或 -

    选择该模型。 在 “挖掘模型” 菜单上,选择 “设置模型筛选器”

  2. “模型筛选器” 对话框的 “挖掘结构列” 文本框中,单击网格中的第一行。

    下拉列表只显示该表中列的名称。

  3. 在“挖掘结构列”文本框中,选择“ 性别”。

    文本框左侧的图标会发生改变,以指示所选项是表还是列。

  4. 单击“ 运算符 ”文本框,然后从列表中选择相等 (=) 运算符。

  5. 单击“ ”文本框,然后键入 M

  6. 单击网格中的下一行。

  7. 单击“ 确定” 关闭“ 模型筛选器 ”对话框。

    筛选器显示在 “属性” 窗口中。 或者,可以从“属性”窗口启动“模型筛选器”对话框。

  8. 重复上述步骤,但这次将模型TM_Decision_Tree_Female命名为 ,并在“值”文本框中键入 F

处理筛选的模型

模型经过部署和处理后才能使用。 有关处理模型的详细信息,请参阅 处理目标邮件结构中的模型 (基本数据挖掘教程)

处理筛选后的模型

  1. 右键单击模型, TM_Decision_Tree_Male 然后选择 “处理挖掘结构和所有模型

  2. 单击“ 运行 ”以处理新模型。

  3. 处理完成后,单击两个处理窗口上的“ 关闭 ”。

    现在,“挖掘模型”选项卡中显示了两个新 模型

评估结果

查看结果并评估筛选后的模型的准确性,与您对前三个模型的操作非常相似。 有关详细信息,请参阅:

浏览决策树模型(数据挖掘基础教程)

测试提升图的准确性(数据挖掘基础教程)

浏览筛选后的模型

  1. 数据挖掘Designer中选择“挖掘模型查看器”选项卡。

  2. 在“挖掘模型”框中,选择 。TM_Decision_Tree_Male

  3. 幻灯片 放映级别3

  4. Background 值更改为 1

  5. 将光标悬停在标记为 “全部 ”的节点上,以查看自行车购买者与非自行车购买者的数量。

  6. TM_Decision_Tree_Female重复步骤 1 - 5。

  7. TM_Decision_Tree浏览 的结果以及按性别筛选的模型。 与所有自行车购买者相比,男性和女性自行车购买者与未经筛选自行车购买者具有一些相同特征,但所有这三个群体也存在一些重要差异。 这是一个有用的信息,Adventure Works Cycles 可用于开发其市场营销活动。

测试筛选后的模型的提升

  1. 切换到 SQL Server Data Tools (SSDT) 中的数据挖掘Designer中的“挖掘准确性图表”选项卡,然后选择“输入选择”选项卡。

  2. “选择要用于准确性图表的数据集 ”组框中,选择“ 使用挖掘结构测试用例”。

  3. 在“数据挖掘Designer的”输入选择“选项卡上,在”选择要在提升图中显示的可预测挖掘模型列“下,选中”同步预测列和值“复选框。

  4. “可预测列名称” 列中,验证是否为每个模型选择了 “自行车购买者 ”。

  5. “显示 ”列中,选择每个模型。

  6. “预测值 ”列中,选择 1

  7. 选择“ 提升图 ”选项卡以显示提升图。

    您现在会注意到,所有三个决策树模型与随机推测模型相比都有了显著提升,而且表现还超过了聚类分析和 Naive-Bayes 模型。

有关筛选器的详细信息,请参阅 Analysis Services (挖掘模型的筛选器 - 数据挖掘)

有关如何将筛选器应用于嵌套表的示例,请参阅 中间数据挖掘教程 (Analysis Services - 数据挖掘)

课程中的前一个任务

测试提升图的准确性(数据挖掘基础教程)

下一课

第 6 课:创建和使用预测(数据挖掘基础教程)

另请参阅

数据挖掘中级教程(Analysis Services - 数据挖掘)
挖掘模型任务和操作指南
从挖掘模型中删除筛选器
挖掘模型的筛选器(Analysis Services - 数据挖掘)