向 Targeted Mailing 结构中添加新模型(数据挖掘基础教程)
在本任务中,将使用数据挖掘设计器的**“挖掘模型”**选项卡定义两个附加模型。 您将使用 Microsoft 聚类分析算法和 Microsoft Naive Bayes 算法创建模型。 之所以选择这两种算法,是因为它们能够预测离散值(例如,自行车购买行为)。 有关这些算法的详细信息,请参阅 Microsoft 聚类分析算法和 Microsoft Naive Bayes 算法。
创建聚类分析挖掘模型
切换到 SQL Server Data Tools (SSDT) 中数据挖掘设计器的**“挖掘模型”**选项卡。
请注意,设计器显示两列,一列是挖掘结构,另一列是在前一课中创建的 TM_Decision_Tree 挖掘模型。
右键单击**“结构”列,选择“新建挖掘模型”**。
在**“新建挖掘模型”对话框中的“模型名称”**中,键入 TM_Clustering。
在**“算法名称”中,选择“Microsoft 聚类分析”**。
单击“确定”。
新模型现在显示在数据挖掘设计器的**“挖掘模型”**选项卡中。 此模型是用 Microsoft 聚类分析算法生成的,它将具有相似特征的客户进行分类并预测每个分类的自行车购买行为。 虽然您可以修改新模型的列用法和属性,但在本教程中不需要对 TM_Clustering 模型进行任何更改。
创建 Naive Bayes 挖掘模型
在数据挖掘设计器的**“挖掘模型”选项卡中,右键单击“结构”列,并选择“新建挖掘模型”**。
在**“新建挖掘模型”对话框中的“模型名称”**下,键入 TM_NaiveBayes。
在**“算法名称”中,选择 Microsoft Naive Bayes,再单击“确定”**。
此时将显示一条消息,说明 Microsoft Naive Bayes 算法不支持 Age 和 Yearly Income 列,这些都是连续列。
单击**“是”**,以确认此消息并继续下面的操作。
新模型将显示在数据挖掘设计器的**“挖掘模型”**选项卡中。 虽然您可以在此选项卡中修改所有模型的列用法和属性,但在本教程中不需要对 TM_NaiveBayes 模型进行任何更改。
课程中的下一个任务
处理 Targeted Mailing 结构中的模型(数据挖掘基础教程)