处理 Targeted Mailing 结构中的模型(数据挖掘基础教程)

必须先部署 Analysis Services 项目并处理挖掘结构和挖掘模型,然后才能浏览或使用已创建的挖掘模型。

  • 部署 会将项目发送到服务器,并在服务器上的该项目中创建任何对象。

  • 处理 使用关系数据源中的数据填充 Analysis Services 对象。

模型经过部署和处理后才能使用。 此外,当您对模型进行任何更改(如添加新数据)时,必须重新部署和重新处理模型。

确保与 HoldoutSeed 一致

部署项目并处理结构和模型后,将数据结构中的各行根据数值种子值分配给定型集或测试集。 默认情况下,数值种子值是根据数据结构的属性计算的。 但是,如果您更改过模型的某些方面,该种子值将变化,导致结果略有不同。 因此,为了确保结果与此处所述相同,我们将任意分配固定的12维持种子。 维持种子用来初始化抽样算法的种子,并确保以大体相同的方式对所有挖掘结构及其模型中的数据进行分区。

此值不影响定型集内的事例数,它仅确保每次生成模型时将使用相同的分区方法。

有关维持种子的详细信息,请参阅 训练和测试数据集

设置维持种子

  1. 单击 SQL Server Data Tools (SSDT) 中的数据挖掘Designer中的“挖掘结构”选项卡或“挖掘模型”选项卡。

    目标邮件挖掘结构 显示在 “属性 ”窗格中。

  2. 确保按 F4 打开“属性”窗格。

  3. 确保 CacheMode 设置为 KeepTrainingCases

  4. 对于 HoldoutSeed,输入 12

部署并处理模型

在数据挖掘Designer中,可以根据对模型或基础数据所做的更改范围来决定处理哪些对象:

在本任务中,因为数据和模型是新的,我们将同时处理结构和所有模型。

部署项目并处理所有挖掘模型

  1. 在“ 挖掘模型 ”菜单中,选择“ 处理挖掘结构和所有模型”。

    如果更改了结构,系统将提示您在处理模型之前生成和部署项目。 单击 “是”

  2. 在“处理挖掘结构 - 目标邮件”对话框中单击“运行”。

    “处理进度” 对话框将打开以显示有关模型处理的详细信息。 模型处理可能需要一些时间,具体取决于您的计算机。

  3. 模型处理完成后,在 “处理进度” 对话框中单击 “关闭”

  4. 在“处理挖掘结构 - <结构>”对话框中单击“关闭”。

课程中的前一个任务

向 Targeted Mailing 结构中添加新模型(数据挖掘基础教程)

下一课

第 4 课:浏览 Targeted Mailing 模型(数据挖掘基础教程)

另请参阅

处理要求和注意事项(数据挖掘)