PDF

总结

项目 说明
发布状态 正式版
产品 Excel
Power BI(语义模型)
Power BI(数据流)
Fabric(数据流 Gen2)
Power Apps(数据流)
Dynamics 365 Customer Insights
支持的身份验证类型 匿名(联机)
基本(联机)
组织帐户(联机)
Windows(联机)
函数参考文档 Pdf.Tables

注意

由于部署计划和特定于主机的功能,某些功能可能只存在于一个产品中。

注意

Power BI Premium 中不支持 PDF。

先决条件

无。

支持的功能

  • 导入

从 Power Query Desktop 连接到 PDF 文件

要从 Power Query Desktop 建立连接:

  1. 在连接器选择中选择 PDF 选项。

  2. 浏览到并选择要上传的 PDF 文件。 然后选择“打开”。

    从文件资源管理器中选择 PDF 文件。

    如果 PDF 文件处于联机状态,请使用 Web 连接器连接到该文件。

  3. 导航器中,选择所需的文件信息,然后选择加载以加载数据,或是选择转换数据以继续在 Power Query 编辑器中转换数据。

    导入到 Power Query Desktop 导航器中的 PDF 文件。

从 Power Query Online 连接到 PDF 文件

要从 Power Query Online 建立连接:

  1. 在连接器选择中选择 PDF 选项。

  2. 在出现的 PDF 对话框中,提供 PDF 文件位置的文件路径或 URL。 如果要加载本地文件,也可以选择上传文件(预览),以浏览到本地文件或拖放文件。

    访问 PDF 文件的连接信息。

  3. 如有必要,选择本地数据网关,以访问 PDF 文件。

  4. 如果这是首次访问此 PDF 文件,请选择身份验证类型并登录到帐户(如果需要)。

  5. 导航器中,选择所需的文件信息,然后选择转换数据以继续在 Power Query 编辑器中转换数据。

    导入到 Power Query Online 导航器中的 PDF 文件。

限制和注意事项

访问大型 PDF 文件

访问大型 PDF 文件时,可以使用以下策略来提高性能和减少超时。 这些策略要求在编辑栏或高级编辑器中编辑 Pdf.Tables 函数的用法。

  • 尝试使用 StartPageEndPage 选项一次选择多个页面,或者一次选择一个小范围,根据需要迭代整个文档。
  • 如果 PDF 文档是单个大型表,则 MultiPageTables 此选项可能会收集非常大的中间值,因此将其禁用可能会有所帮助。

Pdf.Tables 中可找到可用选项的完整列表。

处理多行行

如果无法正确标识多行行,则可能可使用 UI 操作或自定义 M 代码清理数据。 例如,可以使用 Table.FillDown 将不对齐的数据复制到相邻行,或者使用 Table.Group 对相邻行进行分组和合并。

高级容量中的 Power BI 数据流

在高级容量的数据流上使用 PDF 连接器时,PDF 连接器无法正确建立连接。 要使 PDF 连接器能够处理高级容量中的数据流,请将该数据流配置为使用网关,并确认与该数据流的连接经过网关。