简介

已完成

与大多数人一样,你在一家公司工作,公司要求你生成 Microsoft Power BI 报表。 数据驻留在多个不同的数据库和文件中。 这些数据存储库彼此之间不同,某些存储库在 Microsoft SQL Server 中,某些存储库在 Microsoft Excel 中,但所有数据都是相关的。

注意

实验室之前的模块部分仅供参考。 你将有机会在实验室中使用真实数据。

在本模块方案中,你在 Tailwind Traders 工作。 高层领导向你分配了一项工作,即创建一套依赖于多个不同位置的数据的报表。 跟踪销售事务的数据库位于 SQL Server 中,关系数据库包含每个客户购买的物品以及购买的时间。 它还跟踪进行销售的员工以及员工姓名和员工 ID。 但该数据库不包含员工的雇用日期、职务或经理的身份。 若要获得该信息,需要访问人力资源部门保存的 Excel 文件。 你一直在请求他们使用 SQL 数据库,但他们还没有机会实现这一点。

当物品发货时,发货记录保留在公司刚刚开始使用的仓库应用程序中。 开发人员选择将数据以一组 JSON 文档的形式存储在 CosmosDB 中。

Tailwind Traders 提供了一个可帮助进行财务预测的应用程序,因此,他们可以根据过去的趋势预测今后几个月和几年的销售情况。 这些预测数据存储在 Microsoft Azure Analysis Services 中。 下面是要求你合并其中数据的多个数据源的视图。

Power Query 将数据从各种位置传递到 Power BI 的屏幕截图。

必须先从各种数据源提取数据,然后才能创建报表。 与 SQL Server 的交互不同于 Excel,因此你应该了解两个系统之间的细微差别。 了解了系统之后,可以使用 Power Query 来帮助清理数据,例如重命名列、替换值、删除错误以及合并查询结果。 Excel 中也提供了 Power Query。 清理并组织数据后,便可以在 Power BI 中生成报表。 最后,将合并的语义模型和报表发布到 Power BI 服务。 在这里,其他人可以使用你的语义模型生成其自己的报表,或者使用你已生成的报表。 此外,如果其他人生成了你要使用的语义模型,你也可以从该数据集生成报表!

本模块将重点介绍第一步:从不同的数据源获取数据并使用 Power Query 将数据导入 Power BI 中。

学完本模块后,你将能够:

  • 标识数据源并连接到数据源
  • 从 Microsoft SQL Server 等关系数据库中获取数据
  • 从 Microsoft Excel 等文件中获取数据
  • 从应用程序中获取数据
  • 从 Azure Analysis Services 中获取数据
  • 选择存储模式
  • 修复性能问题
  • 解决数据导入错误