浏览 Naive Bayes 模型(数据挖掘基础教程)

Microsoft Naive Bayes 算法提供了多种方法,用于显示自行车的购买和输入属性之间的交互。

Microsoft Naive Bayes 查看器提供了以下选项卡,以便在浏览 Naive Bayes 挖掘模型时使用。

依赖关系网络

属性配置文件

属性特征

属性对比

以下部分说明如何浏览其他挖掘模型。

依赖关系网络

**“依赖关系网络”选项卡的工作方式与 Microsoft 树查看器的“依赖关系网络”**选项卡的工作方式相同。 查看器中的每个节点代表一个属性,而节点之间的线条代表关系。 在查看器中,您可以查看影响可预测属性 Bike Buyer 的状态的所有属性。

在“依赖关系网络”选项卡中浏览模型

  1. 使用**“挖掘模型查看器”选项卡顶部的“挖掘模型”**列表切换到 TM_NaiveBayes 模型。

  2. 使用**“查看器”列表切换到“Microsoft Naive Bayes 查看器”**。

  3. 单击 Bike Buyer 节点以确定它的依赖关系。

    粉色阴影指示所有属性都会对自行车购买行为产生影响。

  4. 调整滑块可标识影响最大的属性。

    向下滑动滑块时,将只保留对 [Bike Buyer] 列影响最大的属性。 通过调整滑块,可以发现影响最大的几个属性为:拥有汽车的数量、通勤距离以及子女总数。

返回页首

属性配置文件

**“属性配置文件”**选项卡说明输入属性的不同状态如何影响可预测属性的结果。

在“属性配置文件”选项卡中浏览模型

  1. 在**“可预测”**框中,确认已选中 Bike Buyer

  2. 如果**“挖掘图例”妨碍“属性配置文件”**的显示,请将它移开。

  3. 在**“直方图”**条框中,选择 5

    在我们的模型中,任意一个变量的最大状态数均为 5。

    系统会列出影响该可预测属性的状态的属性以及输入属性的每个状态的值及其在该可预测属性的每个状态中的分布。

  4. 在**“属性”**列中,查找 Number Cars Owned。 请注意,自行车购买者(标为 1 的列)与非自行车购买者(标为 0 的列)的直方图的差异。 如果一个人拥有的汽车数量为 0 或 1,则此人很有可能会购买自行车。

  5. 双击自行车购买者(标为 1 的列)列中的 Number Cars Owned 单元格。

    **“挖掘图例”**将显示一个更为详细的视图。

返回页首

属性特征

使用**“属性特征”**选项卡,可以选择属性和值,以查看所选值事例中出现其他属性值的频率。

在“属性特征”选项卡中浏览模型

  1. 在**“属性”**列表中,确认已选中 Bike Buyer

  2. 将**“值”**设置为 1

    在查看器中,您将看到,家中无子女、通勤距离较近和居住在北美洲地区的客户更有可能购买自行车。

返回页首

属性对比

使用**“属性对比”**选项卡,可以调查自行车购买的两个离散值与其他属性值之间的关系。 由于 TM_NaiveBayes 模型只有 1 和 0 两个状态,因此您无需对查看器进行任何更改。

在查看器中,您会看到,没有汽车的人一般会购买自行车,而有两辆汽车的人一般不会购买自行车。

下一课

第 5 课:测试模型(数据挖掘基础教程)

课程中的前一个任务

浏览聚类分析模型(数据挖掘基础教程)

请参阅

参考

“属性对比”选项卡(挖掘模型查看器)

“属性配置文件”选项卡(挖掘模型查看器)

“属性特征”选项卡(挖掘模型查看器)

“依赖关系网络”选项卡(挖掘模型查看器)

概念

使用 Microsoft Naive Bayes 查看器浏览模型