从文件中获取数据

已完成

组织通常会将数据导出并存储在文件中。  “平面文件”为可能采用的文件格式之一。 “平面文件”是一种文件类型,其中只包含一个数据表,并且每行数据都具有相同的结构。 该文件不包含层次结构。  你可能已经熟悉最常见的平面文件类型,例如逗号分隔值 (.csv) 文件、带分隔符的文本 (.txt) 文件和固定列宽文件。 另一种类型的文件是来自不同应用程序的输出文件,如 Microsoft Excel 工作簿 (.xlsx)。

“从平面文件获取数据”图标的屏幕截图。

Power BI Desktop 允许从多种类型的文件中获取数据。 使用 Power BI Desktop 中的“获取数据”功能时,可以看到一个可用选项列表。  以下各节将说明如何从存储在本地计算机上的 Excel 文件中导入数据。

方案

Tailwind Traders 的人力资源 (HR) 团队已准备好一个平面文件,其中包含组织内的部分员工数据,如员工姓名、雇用日期、职位和上级经理。  他们请求使用这些数据以及位于其他多个数据源中的数据生成 Power BI 报表。

平面文件位置

第一步是确定要用于导出和存储数据的文件位置。

你的 Excel 文件可能位于以下位置之一:

  • 本地 - 你可以将数据从本地文件导入 Power BI 中。 文件不会移动到 Power BI 中,并且不会保留指向该文件的链接。 而是会在 Power BI 中创建一个新的语义模型,并将 Excel 文件中的数据加载到其中。 因此,对原始 Excel 文件所做的更改不会体现在 Power BI 语义模型中。 对于未更改的数据,可以使用本地数据导入。

  • OneDrive for Business - 你可以从 OneDrive for Business 将数据拉取到 Power BI 中。 这种方法可以有效地使 Excel 文件与 Power BI 中的语义模型、报表和仪表板保持同步。 Power BI 会定期连接到 OneDrive 上的文件。 如果发现任何更改,语义模型、报表和仪表板将在 Power BI 中自动更新。

  • OneDrive 个人版 - 你可以使用个人 OneDrive 帐户上文件中的数据,并获得与 OneDrive for Business 相同的诸多优势。 但是,你需要使用个人 OneDrive 帐户登录,并选择“使我保持登录状态”选项。 请与系统管理员联系,以确定你的组织是否允许这种类型的连接。

  • SharePoint 团队网站 - 将 Power BI Desktop 文件保存到 SharePoint 团队网站的过程与保存到 OneDrive for business 类似。 主要区别在于从 Power BI 连接到文件的方式。 你可以指定 URL 或连接到根文件夹。

    从本地存储的文件、云 OneDrive 或 SharePoint 中获取数据的屏幕截图。

使用云选项(如 OneDrive 或 SharePoint 团队网站)是使文件与 Power BI 中的语义模型、报表和仪表板保持同步的最有效方法。但是,如果数据不会经常更改,则可以在本地计算机上保存文件。

连接到文件中的数据

在 Power BI 中的“主页”选项卡上,选择“获取数据”。 在显示的列表中,选择所需的选项,例如“Text/CSV”或“XML”。 在此示例中,选择“Excel”。

提示

“主页”选项卡中包含一些快速访问数据源选项,例如“获取数据”按钮旁的如“Excel”。

“主页”功能区 -“获取数据”下拉菜单 - 选择“Excel”的屏幕截图。

根据所做的选择,你需要查找并打开数据源。 系统可能会提示你登录到 OneDrive 等服务,以对你的请求进行身份验证。 在本示例中,你将打开存储在桌面上的“员工数据”Excel 工作簿(请记住,不会提供用于练习的文件,这些是假设步骤)。

选择存储在 Desktop 上名为“员工数据”的文件的屏幕截图。

选择要导入的文件数据

文件连接到 Power BI Desktop 后,将打开“导航器”窗口。 此窗口将显示数据源(在此示例中为 Excel 文件)中可用的数据。 你可以选择一个表或实体来预览其内容,以确保将正确的数据加载到 Power BI 模型中。

选中要引入 Power BI 的表所对应的复选框。 此选择将激活“加载”和“转换数据”按钮,如下图所示。

Power BI Desktop 中“导航器”窗口的屏幕截图。

现在,你可以选择“加载”按钮以自动将数据加载到 Power BI 模型,或者选择“转换数据”按钮以启动 Power Query 编辑器,在该编辑器中,你可以查看和清理数据,然后再将其加载到 Power BI 模型中。

我们通常建议对数据进行转换,此过程将在此模块的后面部分进行讨论。 对于此示例,可以选择“加载”。

更改源文件

在开发过程中或者在文件存储位置发生更改的情况下,你可能必须更改数据源的源文件的位置。  要使报表保持最新状态,你需要在 Power BI 中更新文件连接路径。

Power Query 提供了多种方法来完成此任务,因此你可以根据需要进行此类更改。

  1. 数据源设置
  2. 查询设置
  3. 高级编辑器

警告

如果要更改文件路径,请确保重新连接到具有相同文件结构的同一文件。 对文件进行的任何结构更改(如删除或重命名源文件中的列)都将破坏报表模型。

例如,尝试在数据源设置中更改数据源文件路径。 选择 Power Query 中的“数据源设置”。 在“数据源设置”窗口中,选择相应文件,然后选择“更改源”。 更新“文件路径”或使用“浏览”选项查找文件,选择“确定”,然后选择“关闭”。

Power BI Desktop 中“数据源设置”窗口的屏幕截图。