Excel 源

Excel 源从 Microsoft Excel 工作簿的工作表或范围中提取数据。

Excel 源提供了四种提取数据的数据访问方式:

  • 表或视图。

  • 变量中指定的表或视图。

  • SQL 语句的运行结果。 查询可以是参数化查询。

  • 存储在变量中的 SQL 语句的运行结果。

重要

在 Excel 中,工作表或范围等同于表或视图。 Excel 源和目标编辑器中的可用表列表显示现有工作表(以追加到工作表名称后的 $ 符号标识,如 Sheet1$)和命名区域(不用 $ 符号标识,如 MyRange)。 有关详细信息,请参阅“使用注意事项”部分。

Excel 源使用 Excel 连接管理器与数据源建立连接,连接管理器可指定要使用的工作簿文件。 有关详细信息,请参阅 Excel Connection Manager

Excel 源有一个常规输出和一个错误输出。

使用注意事项

Excel 连接管理器使用 Microsoft OLE DB Provider for Jet 4.0 及其支持的 Excel ISAM (索引顺序访问方法) 驱动程序连接和将数据读取和写入 Excel 数据源。

许多现有的 Microsoft 知识库文章都记录了此提供程序和驱动程序的行为,尽管这些文章并不特定于 Integration Services 或其前置数据转换服务,但你可能想要了解可能导致意外结果的某些行为。 有关 Excel 驱动程序的使用及行为的一般信息,请参阅 如何将 ADO 与来自 Visual Basic 或 VBA 的 Excel 数据一起使用

当从 Excel 数据源读取数据时,Jet 访问接口和 Excel 驱动程序的下列行为可能会导致意外结果。

  • 数据源。 Excel 工作簿中的数据源可以是工作表(必须追加 $ 符号,如 Sheet1$)或命名区域(如 MyRange)。 在 SQL 语句中,工作表的名称必须加以分隔(如 [Sheet1$]),以避免 $ 符号引起语法错误。 查询生成器可自动添加这些分隔符。 指定工作表或范围时,该驱动程序将读取从工作表或范围左上角第一个非空单元开始的连续单元块。 因此,源数据中不能有空行,在标题或页眉行与数据行之间也不能有空行。

  • 缺少值。 Excel 驱动程序读取指定源中一定数量的行(默认情况下为 8 行)以推测每列的数据类型。 如果推测出列可能包含混合数据类型(尤其是混合了文本数据的数值数据时),驱动程序将决定采用占多数的数据类型,并对包含其他类型数据的单元返回 Null 值。 (如果各种数据类型的数量相当,则采用数值类型。)Excel 工作表中大部分单元格格式设置选项不会影响此数据类型判断。 可以通过指定导入模式来修改 Excel 驱动程序的此行为。 若要指定导入模式,请将“属性”窗口中 Excel 连接管理器的连接字符串中的“扩展属性”的值添加到 IMEX=1 “ 。 有关详细信息,请参阅 PRB: Excel Values Returned as NULL Using DAO OpenRecordset(PRB:使用 DAO OpenRecordset 返回的 Excel NULL 值)

  • 截断的文本。 驱动程序在确定 Excel 列是否包含文本数据时,它将基于采样的最长值来选择数据类型(字符串或 memo)。 如果驱动程序没有在其采样的行中发现任何长于 255 个字符的值,那么它会将该列视为 255 个字符的字符串的列而不是 memo 列。 因此,长度超过 255 个字符的值可能会被截断。 若要从 memo 列导入数据而不发生截断,必须确保至少一个采样行中的 memo 列包含的值的长度超过 255 个字符,否则必须增加驱动程序采样的行数,使其包括这样的行。 你可以通过增加 HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Jet\4.0\Engines\Excel 注册表项下的 TypeGuessRows 的值来增加用作示例的行数。 有关详细信息,请参阅 PRB:从 Jet 4.0 OLEDB 源传输数据失败并出现错误

  • 数据类型。 Excel 驱动程序只识别有限的一组数据类型。 例如,所有数值列均解释为双精度 (DT_R8),并且所有字符串列(除了 memo 列)均解释为 255 个字符的 Unicode 字符串 (DT_WSTR)。 Integration Services 映射 Excel 数据类型,如下所示:

    • 数值 - 双精度浮点 (DT_R8)

    • 货币 - 货币 (DT_CY)

    • 布尔 - 布尔 (DT_BOOL)

    • 日期/时间 - datetime (DT_DATE)

    • 字符串 - Unicode 字符串,长度为 255 (DT_WSTR)

    • Memo - Unicode 文本流 (DT_NTEXT)

  • 数据类型和长度转换。 Integration Services 不会隐式转换数据类型。 因此,在将其加载到非 Excel 目标之前,可能需要使用“派生列”或“数据转换”转换来显式转换 Excel 数据,或在将它加载到 Excel 目标之前,对非 Excel 数据进行转换。 这种情况下,可能需要通过使用导入和导出向导(它将自动配置所需转换)来创建初始包。 下面是一些可能必需的转换的示例:

    • Unicode Excel 字符串列与具有特定代码页的非 Unicode 字符串列之间的转换

    • 在 255 个字符的 Excel 字符串列和不同长度的字符串列之间转换

    • 双精度 Excel 数值列与其他类型的数值列之间的转换

Excel 源配置

可以通过 SSIS 设计器或以编程方式来设置属性。

有关可以在 “Excel 源编辑器” 对话框中设置的属性的详细信息,请单击下列主题之一:

“高级编辑器” 对话框反映了所有能以编程方式设置的属性。 有关可以在 “高级编辑器” 对话框中或以编程方式设置的属性的详细信息,请单击下列主题之一:

有关循环遍历 Excel 文件中的某个组的信息,请参阅 使用 Foreach 循环容器,循环遍历 Excel 文件和表