SSIS 如何创建 ETL 包
适用于: SQL Server Azure 数据工厂中的 SSIS Integration Runtime
在本教程中,你将学习如何使用 SSIS 设计器创建一个 Microsoft SQL Server Integration Services 包。 所创建的包将从平面文件提取数据,重新设置数据的格式,然后将已重新设置格式的数据插入到事实数据表中。 在下列课程中,将扩展包以阐释循环、包配置、日志记录和错误流。
在安装教程的示例数据的同时,也会安装将在课程中创建的完整的包版本。 使用完整的包,您可以按需要跳过前面几课而从后面的课程开始学习教程。 如果本教程是你第一次使用包或新的开发环境,我们建议从第 1 课开始学习。
什么是 SQL Server Integration Services (SSIS)?
Microsoft SQL Server Integration Services (SSIS) 是一个可用于生成高性能数据集成解决方案的平台,其中包括数据仓库的提取、转换和加载 (ETL) 包。 SSIS 包括用于生成和调试包的图形工具和向导;用于执行 FTP 操作等工作流函数、执行 SQL 语句和发送电子邮件的任务;用于提取和加载数据的数据源和目标;用于清理、聚合、合并和复制数据的转换;用于管理包执行和存储的管理数据库 SSISDB
;以及用于对 Integration Services 对象模型进行编程的应用程序编程接口 (API)。
学习内容
熟悉 Microsoft SQL Server Integration Services 中的新工具、控件和功能的最好方法,就是使用它们。 本教程将指导使用 SSIS 设计器创建一个 ETL 包,其中包含循环、配置、错误流逻辑和日志记录。
先决条件
本教程适用于熟悉基本数据库操作,但对 SQL Server Integration Services 中的新功能认识有限的用户。
若要运行本教程,必须安装下列组件:
SQL Server 和 Integration Services。 若要安装 SQL Server 和 SSIS,请参阅安装 Integration Services。
AdventureWorksDW2022
示例数据库。 你可以从 AdventureWorks 示例数据库下载AdventureWorksDW2022
数据库,并还原备份。示例数据文件。 示例数据与 SSIS 课程包一起提供。 要将示例数据和课程包下载为 Zip 文件,请参阅 SQL Server Integration Services 教程文件。
- 为了防止意外更改发生,zip 文件中的大部分文件都是只读文件。 若要将输出写入到文件或更改输出,必须在文件属性中关闭只读属性。
- 示例包假定数据文件位于文件夹
C:\Program Files\Microsoft SQL Server\100\Samples\Integration Services\Tutorial\Creating a Simple ETL Package
中。 如果将下载内容解压缩到其他位置,必须在示例包中的多个位置更新文件路径。
本教程中的课程
第 1 课:使用 SSIS 创建项目和基本包
在本课中,将创建一个简单的 ETL 包,从单个平面文件中提取数据,再使用查找转换转换数据,最后将所得结果加载到目标事实数据表中。
第 2 课:使用 SSIS 添加循环
在本课中,将扩展第 1 课中创建的包,以便利用新增的循环功能,将多个平面文件提取到单个数据流进程中。
第 3 课:使用 SSIS 添加日志记录
在本课中,将扩展第 2 课中创建的包,以便利用新增的日志记录功能。
第 4 课:使用 SSIS 添加错误流重定向
在本课中,将扩展第 3 课中创建的包,以便利用新增的错误输出配置。
第 5 课:添加包部署模型的 SSIS 包配置
在本课中,将扩展第 4 课中创建的包,以便利用新增的包配置选项。
第 6 课:在 SSIS 中对项目部署模型使用参数
在本课中,将扩展第 5 课中创建的包,以便将新参数用于项目部署模型。