使用聚合转换来聚合数据集中的值

适用于:SQL Server Azure 数据工厂中的 SSIS Integration Runtime

若要添加并配置聚合转换,则包必须已包含至少一个数据流任务和一个源。

聚合数据集中的值

  1. 在 SQL Server Data Tools (SSDT)中,打开包含所需包的 Integration Services 项目。

  2. 在解决方案资源管理器中,双击该包将其打开。

  3. 单击 “数据流” 选项卡,然后从 “工具箱”中将聚合转换拖动到设计图面。

  4. 将连接线从源或前一转换拖到聚合转换,从而将聚合转换连接到数据流。

  5. 双击此转换。

  6. “聚合转换编辑器” 对话框中单击 “聚合” 选项卡。

  7. “可用输入列” 列表中,选中要对其值进行聚合运算的列旁边的复选框。 所选的列出现在表中。

    注意

    可以多次选择同一列,这样便可对此列应用多次转换。 若要唯一标识聚合,请在列输出别名的默认名称后面追加一个数字。

  8. 或者,修改 “输出别名” 列中的值。

  9. 若要更改默认聚合操作 “分组依据”,请选择 “操作” 列表中的其他操作。

  10. 若要更改默认比较,请选择 “比较标志” 列中所列出的单个比较标志。 默认情况下,比较将忽略大小写、假名类型、不占位字符和字符宽度。

  11. 对于 “非重复计数” 聚合,如果需要,可在 “非重复键计数” 列中指定非重复值的精确计数,或者在 “非重复键数范围” 列中选择近似的数字。

    注意

    由于转换可以为它的工作预先分配合适的内存数量,因此可通过提供不同值的个数(准确或近似)来优化性能。

  12. 或者,单击 “高级” 并更新聚合转换输出的名称。 如果聚合包含 Group By 操作,则可以在 “键范围” 列中选择分组键值的近似计数,或者在 “键” 列中指定分组键值的准确数目。

    注意

    由于转换可以为它的工作预先分配合适的内存数量,因此可通过提供不同值的个数(准确或近似)来优化性能。

    注意

    “键范围”“键” 选项互斥。 如果在两个列中都输入值,将使用 “键范围”“键” 二者中的更大值。

  13. 或者,单击 “高级” 选项卡并设置应用于优化聚合转换所执行的所有操作的属性。

  14. 单击“确定”。

  15. 若要保存更新后的包,请单击 “文件” 菜单上的 “保存选定项”

另请参阅

聚合转换
Integration Services 转换
Integration Services 路径
数据流任务