通过探索序列聚类分析模型,你了解到区域或收入等其他属性对模型有很强的影响:因此,为了更好地了解序列,你将创建一个相关的序列聚类分析模型,并删除与客户人口统计相关的属性。
在此任务中,你将创建区域序列聚类分析模型的副本,然后从模型中删除与序列不直接相关的任何列。
新模型将包含与它所基于的挖掘模型相同的所有列。 但是,无需从挖掘结构中删除列,只指定新的挖掘模型忽略列。
创建序列聚类分析模型的副本
在 SQL Server Data Tools (SSDT)的数据挖掘设计器中,单击“ 挖掘模型 ”选项卡。
右键单击要复制的模型,然后选择“ 新建挖掘模型”。
在“ 新建挖掘模型 ”对话框中,键入模型名称,然后选择Microsoft
Sequence Clustering。对于本教程,请键入名称
Sequence Clustering。单击 “确定” 。
从挖掘模型中删除列
在 “挖掘模型 ”选项卡中,在名为“序列聚类分析”的新模型的列中,单击 收入组 属性的行,然后选择“ 忽略”。
对属性 区域重复此步骤。
单击表名称 v Assoc Seq 行项旁边的加号,展开表并查看嵌套表中的列。
新模型应仅包含以下列:
订单编号键
行号键
模型预测
处理新的序列聚类分析模型
在 “挖掘模型 ”选项卡中,右键单击名为
Sequence Clustering的新模型,然后选择“ 进程模型”。由于新的简化挖掘模型基于已处理的结构,因此无需重新处理结构。 您可以只处理新的挖掘模型。
单击 “是 ”将更新的数据挖掘项目部署到服务器。
在“ 进程挖掘模型 ”对话框中,单击“ 运行”。
单击“关闭”以关闭“进程进度”对话框,然后在“进程挖掘模型”对话框中再次单击“关闭”。