第 2 课:使用 SSIS 添加循环
适用于: SQL Server Azure 数据工厂中的 SSIS Integration Runtime
在第 1 课中:使用 SSIS 创建项目和基本包,创建了一个从单个平面文件源中提取数据的包。 然后使用查找转换转换了数据。 最后,程序包将数据加载到 AdventureWorksDW2022
示例数据库中的“FactCurrencyRate”事实数据表的副本中。
提取、转换和加载 (ETL) 过程通常从多个平面文件源中提取数据。 从多个源提取数据需要采用迭代控制流。 Microsoft Integration Services 可以轻松将迭代或循环添加到包。
Integration Services 为循环遍历包提供了两种容器类型:Foreach 循环容器和 For 循环容器。 Foreach 循环容器使用枚举器执行循环,而 For 循环容器则通常使用变量表达式。 本课使用 Foreach 循环容器。
Foreach 循环容器使包能够对指定枚举器的每个成员重复执行控制流。 使用 Foreach 循环容器,可以枚举:
ADO 记录集行
ADO .Net 架构信息
文件和目录结构
系统、包和用户变量
变量中的可枚举对象
集合中的项
XML Path 语言 (XPath) 表达式中的节点
SQL Server 管理对象 (SMO)
在本课程中,将修改第 1 课的示例 ETL 包以使用 Foreach 循环容器,并为该包设置用户定义的包变量。 然后,该变量用于循环访问示例文件夹中的匹配文件。
在本课中,将不修改数据流,而只修改控制流。
注意
如果尚不具备必备条件,请参阅第 1 课必备条件。
课程任务
本课程包含以下任务: