Integration Services 转换

适用于:SQL Server Azure 数据工厂中的 SSIS Integration Runtime

SQL Server Integration Services 转换是包的数据流中对数据进行聚合、合并、分发和修改的组件。 转换还可以执行查找操作并生成样本数据集。 本节介绍 Integration Services 所包括的转换并说明它们是如何工作的。

商业智能转换

下列转换执行商业智能操作,例如清除数据、挖掘文本以及运行数据挖掘预测查询。

转换 描述
渐变维度转换 配置渐变维度更新的转换。
模糊分组转换 对列数据中的值进行标准化的转换。
模糊查找转换 使用模糊匹配查找引用表中的值的转换。
字词提取转换 从文本中提取字词的转换。
字词查找转换 在引用表中查找字词并对从文本中提取的字词进行计数的转换。
数据挖掘查询转换 运行数据挖掘预测查询的转换。
DQS 清理转换 通过应用为数据源创建的规则更正来自连接的数据源的数据的转换。

行转换

下列转换更新列值并创建新列。 转换应用于转换输入中的每个行。

转换 描述
字符映射转换 将字符串函数应用于字符数据的转换。
复制列转换 将输入列的副本添加到转换输出的转换。
数据转换 将列的数据类型转换为另一种数据类型的转换。
派生列转换 用表达式的结果填充列的转换。
导出列转换 将数据流中的数据插入到文件中的转换。
导入列转换 读取文件中的数据并将其添加到数据流中的转换。
脚本组件 使用脚本提取、转换或加载数据的转换。
OLE DB 命令转换 为数据流中的每个行运行 SQL 命令的转换。

行集转换

下列转换将创建新行集。 行集可以包括聚合值和已排序值、样本行集或者透视行集和逆透视行集。

转换 描述
聚合转换 执行聚合(如 AVERAGE、SUM 和 COUNT)的转换。
排序转换 对数据进行排序的转换。
百分比抽样转换 使用百分比指定样本大小来创建样本数据集的转换。
行抽样转换 通过指定样本中的行数来创建样本数据集的转换。
透视转换 创建规范化表的不太规范化版本的转换。
逆透视转换 创建非规范化表的较规范化版本的转换。

拆分和联接转换

以下转换将行分发到不同的输出,创建转换输入的副本,将多个输入联接成一个输出,并执行查找操作。

转换 描述
有条件拆分转换 将数据行路由到不同输出的转换。
多播转换 将数据集分发到多个输出的转换。
Union All 转换 合并多个数据集的转换。
合并转换 合并两个已排序数据集的转换。
合并联接转换 使用 FULL、LEFT 或 INNER 联接将两个数据集联接起来的转换。
查找转换 使用完全匹配查找引用表中的值的转换。
缓存转换 将数据流中已连接数据源的数据写入到缓存连接管理器(将数据保存到缓存文件中)的转换。 查找转换会对缓存文件中的数据执行查找。
平衡数据分发器转换 转换将传入行的缓冲区均匀分布到各个独立线程的输出上,以提升运行在多核和多处理器服务器上的 SSIS 包的性能。

审核转换

Integration Services 包括以下转换,用于添加审核信息和对行进行计数。

转换 描述
审核转换 使环境信息可用于包中数据流的转换。
行计数转换 对通过转换的行进行计数并将最终计数存储到变量中的转换。

自定义转换

还可以编写自定义转换。 有关详细信息,请参阅 开发具有同步输出的自定义转换组件开发具有异步输出的自定义转换组件