修改目标邮件模型(数据挖掘教程)
更新日期: 2007 年 9 月 15 日
您在上一任务中创建的初始挖掘结构包含一个基于 Microsoft 决策树算法的单一挖掘模型。在本任务中,将使用数据挖掘设计器的**“挖掘模型”**选项卡定义两个附加模型。在本任务中,将定义 Naive Bayes 模型和聚类分析模型。
有关详细信息
数据挖掘设计器, 在数据挖掘设计器中管理挖掘模型, Microsoft 聚类分析算法, Microsoft Naive Bayes 算法
创建 Microsoft 聚类分析模型
创建聚类分析挖掘模型
切换到 Business Intelligence Development Studio 中数据挖掘设计器的**“挖掘模型”**选项卡。
请注意,设计器显示两列,一列是挖掘结构,另一列是在本课程的上一任务中创建的初始挖掘模型。
右键单击**“结构”列,选择“新建挖掘模型”**。
此时,系统将打开**“新建挖掘模型”**对话框。
在**“模型名称”**中,键入 TM_Clustering。
在**“算法名称”中,选择“Microsoft 聚类分析”**。
单击**“确定”**。
新模型将显示在数据挖掘设计器的**“挖掘模型”**选项卡中。使用 Microsoft 聚类分析算法生成的模型可对连续属性和离散属性进行分类和预测。虽然您可以修改新模型的列用法和属性,但在本教程中不需要对 TM_Clustering 模型进行任何更改。
创建 Microsoft Naive Bayes 模型
创建 Naive Bayes 模型
在数据挖掘设计器的**“挖掘模型”选项卡中,右键单击“结构”列,并选择“新建挖掘模型”**。
此时,系统将打开**“新建挖掘模型”**对话框。
在**“模型名称”**中,键入 TM_NaiveBayes。
在**“算法名称”中,选择 Microsoft Naive Bayes。单击“确定”**。
将显示一条消息,说明 Microsoft Naive Bayes 算法不支持连续列。若要在 Naive Bayes 模型中使用这些列,必须对其进行离散化。对于本教程,只需忽略这些列即可。
单击**“是”**,以确认此消息并继续下面的操作。
此时在**“挖掘模型”**选项卡中将显示新模型。虽然您可以在此选项卡中修改所有模型的列用法和属性,但在本教程中不需要对 TM_NaiveBayes 模型进行任何更改。
处理挖掘模型
现在,挖掘模型的结构和参数都已完成设置,可以部署并处理模型了。您可以处理与挖掘结构关联的特定挖掘模型,也可以处理与结构关联的所有模型。
有关详细信息
部署项目并处理选定的挖掘模型
在 BI Development Studio 的**“挖掘模型”**菜单中,从网格中的一列或多列模型中选择一个挖掘模型。
在**“挖掘模型”菜单中,选择“处理模型”**。
如果更改了挖掘结构,系统将提示您在处理模型之前重新部署结构。单击**“是”**。
在**“处理挖掘结构 – 目标邮件”对话框中单击“运行”**。
**“处理进度”**对话框将打开以显示有关模型处理的详细信息。模型处理可能需要一些时间,具体取决于您的计算机。
模型处理完成后,在**“处理进度”对话框中,单击“关闭”**。
在**“处理挖掘结构 - <结构>”对话框中,单击“关闭”**。
Analysis Services 数据库将部署到服务器上,而挖掘模型也将得到处理。
如果数据库已经部署到服务器上,则可使用下列过程,以便只处理挖掘模型。
在项目已部署完成时处理挖掘模型
在 BI Development Studio 的**“挖掘模型”菜单上,单击“处理挖掘结构和所有模型”**。
**“处理挖掘结构 - <目标邮件>”**对话框打开。
单击**“运行”**。
此时,系统将打开**“处理进度”**对话框,以显示有关模型处理的信息。模型处理可能需要一些时间,具体时间取决于您的计算机。
处理完毕后,在**“处理进度”和“处理挖掘结构 - <目标邮件>”对话框中单击“关闭”**。