将 Integration Services 与数据挖掘一起使用
数据挖掘通常被称为“从大型数据库提取有效、可行信息的过程”。换言之,数据挖掘帮助您发现数据中存在的模式和趋势。Microsoft SQL ServerAnalysis Services 为提取和分析这些模式提供了强大的数据挖掘功能和工具。Integration Services 还提供了许多组件,帮助您管理和查询这些数据挖掘模型。
有关 SQL ServerAnalysis Services 中数据挖掘功能的详细信息,请参阅概述(Analysis Services - 数据挖掘)和数据挖掘项目(Analysis Services - 数据挖掘)。
注意 |
---|
本主题所介绍的部分 Integration Services 组件仅在 SQL Server 的 Enterprise Edition 和 Developer Edition 中可用。 |
连接管理器
连接管理器是与数据源所进行的连接的逻辑表示形式。使用 Analysis Services 连接管理器可以连接到存储挖掘结构和模型的 Analysis Services 数据库。本主题中介绍的所有任务和数据流组件都需要使用 Analysis Services 连接管理器。
Analysis Services 连接管理器
Analysis Services 连接管理器使包能够连接到运行 Analysis Services 数据库的服务器,或连接到用于访问挖掘结构和挖掘模型的 Analysis Services 项目。在 Business Intelligence Development Studio 中开发包时,仅可连接到 Analysis Services 项目。在运行时,包会连接到您已部署 Analysis Services 的服务器和数据库。
有关详细信息,请参阅 Analysis Services 连接管理器。
任务
任务是一些控制流元素,它定义包中执行的工作单元。使用下列任务可以创建或修改数据挖掘结构或模型,还可以处理或查询模型。
Analysis Services 执行 DDL 任务
Analysis Services 执行 DDL 任务运行可以创建、删除或更改挖掘结构和模型的数据定义语言 (DDL) 语句。DDL 语句表示为 Analysis Services 脚本语言 (ASSL) 中的语句,并嵌入 XML for Analysis (XMLA) 命令中。
有关此任务的详细信息,请参阅 Analysis Services 执行 DDL 任务。有关使用 XMLA 创建和更改 Analysis Services 对象的详细信息,请参阅创建和更改对象 (XMLA)。
Analysis Services 处理任务
Analysis Services 处理任务可使 Analysis Services 对象(如挖掘模型)的处理实现自动化。
有关此任务的详细信息,请参阅 Analysis Services 处理任务。有关处理 Analysis Services 对象的详细信息,请参阅处理 Analysis Services 对象。
数据挖掘查询任务
数据挖掘查询任务根据 Analysis Services 内置的数据挖掘模型运行预测查询。预测查询通过使用挖掘模型来创建对新数据的预测,并将其输出保存到一个或多个表中。
有关此任务的详细信息,请参阅数据挖掘查询任务。有关使用 DMX 查询数据挖掘模型的详细信息,请参阅创建 DMX 预测查询。
数据流转换
转换是包的数据流中对数据进行聚合、合并、分发和修改的组件。
数据挖掘查询转换
数据挖掘查询转换针对数据挖掘模型执行预测查询。此转换包含用于创建数据挖掘扩展 (DMX) 查询的查询生成器。通过查询生成器可使用 DMX 语言创建自定义语句,来针对现有挖掘模型计算转换输入数据。与将输出直接保存到一个或多个表中的数据挖掘查询任务不同,数据挖掘查询转换使其输出可供包数据流中的下游组件使用。
有关此转换的详细信息,请参阅数据挖掘查询转换。有关使用 DMX 查询数据挖掘模型的详细信息,请参阅创建 DMX 预测查询。
数据流目标
目标是将数据流中的输出加载到不同类型的数据源或创建内存中数据集的数据流组件。
数据挖掘模型定型目标
数据挖掘模型定型目标将该目标接收到的数据通过数据挖掘模型算法传递,从而为数据挖掘模型定型。在定型过程中,该算法将计算数据中元素的模式及相互关系。对新挖掘模型定型后,可以使用该模型来运行预测查询。
有关详细信息,请参阅数据挖掘模型定型目标。
用于数据挖掘的其他 Integration Services 组件
Integration Services 还有许多其他组件可用于数据挖掘解决方案的一部分。
若要使用数据子集来定型或测试数据挖掘模型,您可以使用:
若要通过删除重复值和标准化值来清除数据,可以使用:
排序转换:对数据排序时删除重复行。有关详细信息,请参阅排序转换。
模糊分组转换:根据相似性而不是完全匹配对行分组。有关详细信息,请参阅模糊分组转换和如何使用模糊分组转换标识相似数据行。
模糊查找转换:根据相似性而不是完全匹配在引用表中查找匹配。有关详细信息,请参阅模糊查找转换。
若要执行文本挖掘,可以使用:
|