单击“ 将模型添加到结构”时,向导将启动该向导,帮助你创建新的挖掘模型以用于现有挖掘结构。 此选项很有用,因为它允许比较基于相同数据或创建自定义模型的模型。
如果 Analysis Services 实例尚未包含所需的数据,请使用 “创建挖掘结构”(SQL Server 数据挖掘加载项) 向导设置挖掘结构。 或者,可以启动其中一个建模向导,然后将新模型添加到向导创建的结构。
若要使用向导不支持的算法创建高级模型,请创建挖掘结构,然后使用 数据挖掘高级查询编辑器添加模型。
将新模型添加到现有结构
在 “数据挖掘 ”功能区上,单击“ 高级”下的箭头,然后选择“ 将模型添加到结构”。
在 “选择结构 ”对话框中,选择包含要使用的数据的结构,然后单击“ 下一步”。
提示:如果不确定哪个挖掘结构包含所需的数据,请使用 文档模型 向导查看有关数据的列和基本统计信息。
如果找不到挖掘结构,请检查当前正在使用的连接。 可能需要打开与其他服务器的连接。
在 “选择挖掘算法 ”对话框中,选择要在新挖掘模型中使用的挖掘算法。
请注意,该窗口提供的选项比向导中显示的要多得多。 可以使用 Analysis Services 服务器上支持的任何算法创建模型,前提是数据兼容。
我们还建议单击“ 参数 ”按钮,打开 “算法参数 ”对话框并自定义算法上的参数。 此选项是创建自定义挖掘模型的最简单方法。
单击 “下一步” 。
在 “选择列 ”对话框中,查看列列表,如有必要,请将列的用法更改为以下值之一:
输入。 指示该列包含可能影响结果的变量,应用作模型的输入。
输入和预测。 表明数据应当用作输入,并且还希望预测这些数据。
仅预测。 指示不应将数据用作模型的输入。
Key。 每个模型至少需要一个密钥。 根据模型类型,还可以选择其他特殊键,例如 SequenceKey 或 TimeKey。
请勿使用。 指示这些数据即便在结构中存在,也不应在模型中使用。
单击“浏览”按钮打开“设置列模型标志”对话框。
花一分钟时间验证每个数据列的使用情况是否适合模型。 这是在尝试处理模型时防止错误的重要步骤。
例如,如果复用为决策树模型创建的结构并将Naïve Bayes算法应用于该结构,则数据类型为
Numeric且内容类型为Continuous的列需要进行分箱或者转换为离散变量。如果结构中的列不适用于新算法,可以通过选择 “不使用”来绕过它们。
在 “设置列模型标志 ”对话框中,查看或设置建模标志(如果有)。
建模标志允许你控制 Null 的处理方式,等等。 有关详细信息,请参阅建模标志(数据挖掘)。
完成后单击 “确定 ”关闭对话框。
在“ 完成 ”对话框中,键入新挖掘模型的名称和说明。
根据生成的模型类型,可能还具有以下选项:
生成完后浏览已完成的挖掘模型。
使用模型中的钻取功能连接到源数据。
有关详细信息,请参阅 挖掘模型的钻取报告。
单击“ 完成 ”保存更改。 正如你所做的那样,新模型将部署到服务器并进行处理。
相关选项
| 选项 | 注释 |
|---|---|
| “选择结构或模型 ”对话框 | 选择要用作生成新模型的基础的现有挖掘结构。 选取的结构必须位于当前连接上。 否则,请使用 “连接到源数据”(Excel 数据挖掘客户端) 工具更改连接。 |
| “选择挖掘算法 ”对话框 | 数据挖掘算法的列表取决于连接到的服务器。 Analysis Services 在标准和企业版中提供不同的算法。 管理员可能还添加了自定义算法。 如果看不到任何算法,请验证是否已连接到 Analysis Services 实例。 |
| 算法参数 對話方塊 | 在这些设置中,可以使用特定于分析方法的参数自定义每个算法。 还可以设置种子,以确保模型的结果可以在多个训练过程中重现。 有关详细信息,请参阅算法参数(SQL Server 数据挖掘加载项)。 |
| 设置列模型标志 對話方塊 | 建模标志可以通过指定如何处理缺失数据来改进模型。 有关详细信息,请参阅建模标志(数据挖掘)。 |
设置列的使用方式
向现有挖掘结构添加新模型时,必须指定模型如何使用挖掘结构中每个数据列。 你可能会发现,此向导中的选项比挖掘结构上的选项更详细。 为什么?
原因是,使用向导一起创建模型和结构时,许多控制算法使用数据的选项会自动设置。 但是,向现有模型添加新模型时,需要手动查看这些选项,并指定是否应使用数据进行分析、数据类型是否正确等。
在向现有数据应用新算法时,可能会收到错误消息,但这些消息通常提供有关允许处理模型所需的更正的详细信息。 典型问题包括:
模型预期的数据类型与结构包含的数据类型不同。
某些算法只能处理数字;有些只能处理文本。 如果新模型的数据类型不正确,则可能需要修改结构以使模型能够处理。
挖掘结构不包含可预测属性。
聚类分析模型无需预测值即可生成,但其他模型通常要求指定单个列进行预测。
数据组合与所选算法不兼容。
某些类型的分析需要根据唯一规则仔细构建的数据。 示例包括预测模型和关联模型。 可以轻松添加相同类型的新模型,可能进行自定义,但数据可能无法与其他算法配合使用。
要求
若要创建数据挖掘模型,必须连接到 Analysis Services 实例。 有关如何创建或更改连接的详细信息,请参阅“连接到源数据”(Excel 数据挖掘客户端)。
如果看不到所需的数据挖掘结构,可能是该结构已保存到其他实例或不同的 Analysis Services 数据库。 有关如何更改为其他数据挖掘连接的信息,请参阅 “连接到数据挖掘服务器”。