浏览顺序分析和聚类分析模型(数据挖掘教程)

现在,“顺序分析和聚类分析”模型已经生成,可以使用数据挖掘设计器的“挖掘模型查看器”选项卡中的 Microsoft 顺序分析和聚类分析查看器浏览该模型了。Microsoft 顺序分析和聚类分析查看器包括五个选项卡:“分类关系图”“分类剖面图”“分类特征”“分类辨别”“状态转换”。有关如何使用此查看器的详细信息,请参阅使用 Microsoft 序列分类查看器查看挖掘模型

“分类关系图”选项卡

“分类关系图”选项卡以图形方式显示在数据库中发现的算法的分类。关系图中的布局表示分类之间的关系,其中相似的分类分在一起。默认情况下,节点颜色的明暗度表示分类中所有事例的密度,节点越暗,包含的事例越多。可以更改节点明暗度代表的含义,使其表示属性和状态。例如,在“明暗度变量”列表中选择“模型”,并在**“状态”列表中选择“自行车帽”**。分类关系图显示分类 9 包含的“自行车帽”密度最大。

“分类剖面图”选项卡

**“分类剖面图”选项卡显示每个分类中存在的序列。分类列在“状态”**列右边的单个列中。

在查看器中,Model.samples 行表示序列数据,Model 行说明了分类中各项的总体分布。Model.samples 行的每个单元中颜色序列的每个线条表示分类中随机选中的用户的行为。单个序列直方图中的每个颜色代表一个产品模型。

例如,分类 3 中的浅蓝色表示 Mountain-200 自行车。该产品模型在大多数序列中以第一种颜色出现,表示客户非常可能先将 Mountain-200 自行车放入购物篮。

“分类特征”选项卡

**“分类特征”**选项卡汇总了分类中各状态间的转换,其中的各栏说明了所选分类属性值的重要性。例如,在分类 10 中,其中一个最重要的特征是客户倾向于先将 ML Mountai 轮胎放入购物篮。

“分类辨别”选项卡

使用**“分类辨别”选项卡,可以比较两个分类,确定模型及其倾向的分类。该选项卡包括四个列:“变量”“值”“分类 1”“分类 2”。如果分类倾向于特定模型,则在“变量”列中相应模型行的“分类 1”“分类 2”**列中将出现一个蓝条。蓝条越长,模型越倾向于该分类。

例如,在查看器中使用**“分类辨别”选项卡,可以通过在“分类 1”中选择分类 2 以及在“分类 2”中选择分类 5,来比较分类 2 和分类 5。一位购买了山地自行车水壶架的客户更可能出现在分类 5 中,如“值”列中的 Mountain Bottle Cage 所示。而购买了旅行车轮胎的客户更可能出现在分类 2 中,如“值”**列中的 Touring Tire 所示。

“状态转换”选项卡

在**“状态转换”**选项卡上,可以选择分类并浏览其状态转换。每个节点都表示模型(如 Mountain-200)的一个状态。线条表示状态间的转换,每个节点都基于转换的可能性。背景色表示分类中节点的频率。

例如,从**“分类”中选中“分类 3”,选中 Touring-3000 节点,然后将“所有链接”**滑块降低几格。您可以在查看器中看到,如果客户将 Touring Tire 放入购物篮,接下来客户把 Touring Tire Tube 放入购物篮的概率为 0.63,如蓝色箭头所示;而也将 Sport 100 自行车放入购物篮的概率为 0.26。