向结构添加模型 (Excel 数据挖掘加载项)

“将模型添加到结构”按钮

单击“ 将模型添加到结构”时,向导将启动该向导,帮助你创建新的挖掘模型以用于现有挖掘结构。 此选项很有用,因为它允许比较基于相同数据或创建自定义模型的模型。

如果 Analysis Services 实例尚未包含所需的数据,请使用 “创建挖掘结构”(SQL Server 数据挖掘加载项) 向导设置挖掘结构。 或者,可以启动其中一个建模向导,然后将新模型添加到向导创建的结构。

若要使用向导不支持的算法创建高级模型,请创建挖掘结构,然后使用 数据挖掘高级查询编辑器添加模型。

将新模型添加到现有结构

  1. “数据挖掘 ”功能区上,单击“ 高级”下的箭头,然后选择“ 将模型添加到结构”。

  2. “选择结构 ”对话框中,选择包含要使用的数据的结构,然后单击“ 下一步”。

    提示:如果不确定哪个挖掘结构包含所需的数据,请使用 文档模型 向导查看有关数据的列和基本统计信息。

    如果找不到挖掘结构,请检查当前正在使用的连接。 可能需要打开与其他服务器的连接。

  3. “选择挖掘算法 ”对话框中,选择要在新挖掘模型中使用的挖掘算法。

    请注意,该窗口提供的选项比向导中显示的要多得多。 可以使用 Analysis Services 服务器上支持的任何算法创建模型,前提是数据兼容。

  4. 我们还建议单击“ 参数 ”按钮,打开 “算法参数 ”对话框并自定义算法上的参数。 此选项是创建自定义挖掘模型的最简单方法。

  5. 单击 “下一步”

  6. “选择列 ”对话框中,查看列列表,如有必要,请将列的用法更改为以下值之一:

    • 输入。 指示该列包含可能影响结果的变量,应用作模型的输入。

    • 输入和预测。 表明数据应当用作输入,并且还希望预测这些数据。

    • 仅预测。 指示不应将数据用作模型的输入。

    • Key。 每个模型至少需要一个密钥。 根据模型类型,还可以选择其他特殊键,例如 SequenceKeyTimeKey

    • 请勿使用。 指示这些数据即便在结构中存在,也不应在模型中使用。

  7. 单击“浏览”按钮打开“设置列模型标志”对话框。

    花一分钟时间验证每个数据列的使用情况是否适合模型。 这是在尝试处理模型时防止错误的重要步骤。

    例如,如果复用为决策树模型创建的结构并将Naïve Bayes算法应用于该结构,则数据类型为Numeric且内容类型为Continuous的列需要进行分箱或者转换为离散变量。

    如果结构中的列不适用于新算法,可以通过选择 “不使用”来绕过它们。

  8. “设置列模型标志 ”对话框中,查看或设置建模标志(如果有)。

    建模标志允许你控制 Null 的处理方式,等等。 有关详细信息,请参阅建模标志(数据挖掘)。

    完成后单击 “确定 ”关闭对话框。

  9. 在“ 完成 ”对话框中,键入新挖掘模型的名称和说明。

    根据生成的模型类型,可能还具有以下选项:

    • 生成完后浏览已完成的挖掘模型。

    • 使用模型中的钻取功能连接到源数据。

      有关详细信息,请参阅 挖掘模型的钻取报告

  10. 单击“ 完成 ”保存更改。 正如你所做的那样,新模型将部署到服务器并进行处理。

选项 注释
“选择结构或模型 ”对话框 选择要用作生成新模型的基础的现有挖掘结构。 选取的结构必须位于当前连接上。 否则,请使用 “连接到源数据”(Excel 数据挖掘客户端) 工具更改连接。
“选择挖掘算法 ”对话框 数据挖掘算法的列表取决于连接到的服务器。 Analysis Services 在标准和企业版中提供不同的算法。 管理员可能还添加了自定义算法。

如果看不到任何算法,请验证是否已连接到 Analysis Services 实例。
算法参数 對話方塊 在这些设置中,可以使用特定于分析方法的参数自定义每个算法。 还可以设置种子,以确保模型的结果可以在多个训练过程中重现。

有关详细信息,请参阅算法参数(SQL Server 数据挖掘加载项)。
设置列模型标志 對話方塊 建模标志可以通过指定如何处理缺失数据来改进模型。 有关详细信息,请参阅建模标志(数据挖掘)。

设置列的使用方式

向现有挖掘结构添加新模型时,必须指定模型如何使用挖掘结构中每个数据列。 你可能会发现,此向导中的选项比挖掘结构上的选项更详细。 为什么?

原因是,使用向导一起创建模型和结构时,许多控制算法使用数据的选项会自动设置。 但是,向现有模型添加新模型时,需要手动查看这些选项,并指定是否应使用数据进行分析、数据类型是否正确等。

在向现有数据应用新算法时,可能会收到错误消息,但这些消息通常提供有关允许处理模型所需的更正的详细信息。 典型问题包括:

  • 模型预期的数据类型与结构包含的数据类型不同。

    某些算法只能处理数字;有些只能处理文本。 如果新模型的数据类型不正确,则可能需要修改结构以使模型能够处理。

  • 挖掘结构不包含可预测属性。

    聚类分析模型无需预测值即可生成,但其他模型通常要求指定单个列进行预测。

  • 数据组合与所选算法不兼容。

    某些类型的分析需要根据唯一规则仔细构建的数据。 示例包括预测模型和关联模型。 可以轻松添加相同类型的新模型,可能进行自定义,但数据可能无法与其他算法配合使用。

要求

若要创建数据挖掘模型,必须连接到 Analysis Services 实例。 有关如何创建或更改连接的详细信息,请参阅“连接到源数据”(Excel 数据挖掘客户端)。

如果看不到所需的数据挖掘结构,可能是该结构已保存到其他实例或不同的 Analysis Services 数据库。 有关如何更改为其他数据挖掘连接的信息,请参阅 “连接到数据挖掘服务器”。

另请参阅

创建数据挖掘模型