数据流

已完成

数据流是基于云的提取、转换和加载 (ETL) 服务,可帮助您从各种源中引入数据并将其转换为支持分析的形式。 Power BI 可以使用数据流处理和引入大量数据。

显示仪表板数据流流程的示意图。

数据流旨在支持以下场景:

  • 创建 Power BI 中的许多数据集和报表可共享的可重用转换逻辑。 数据流可提升基础数据元素的可重用性,从而无需创建单独的云端或本地数据源连接。
  • 公布自己的 Azure Data Lake Gen 2 存储中的数据,从而将其他 Azure 服务连接到原始基础数据。
  • 通过强制分析师连接到数据流而不是连接到基础系统来创建单一事实来源。 这样您就可以控制访问的数据以及向报表创建者公开数据的方式。 您还可将数据映射到行业标准定义,从而创建整洁的特选视图,配合 Microsoft Power Platform 中的其他服务和产品。
  • 如要使用较大数据量并大规模执行 ETL,支持 Power BI Premium 的数据流可高效扩展,为您提供极高的灵活度。 数据流支持各种云端和本地源。
  • 阻止分析师直接访问基础数据源。 报表创建者可以基于数据流进行构建,因此仅允许少数个人访问基础数据源,然后提供数据流的访问权限,支持分析师在数据流的基础上进行构建,这种方式更加方便。 本方法可降低基础系统的负载,支持管理员更精细地控制系统加载刷新的时间。

数据流可以使用 Power Query 转换数据,使用 Microsoft Azure 认知服务和 Azure 机器学习扩充数据,如下图所示。

显示数据流功能的示意图。

创建数据流后,您可以使用 Power BI Desktop 和 Power BI 服务创建以下使用 Common Data Model 深入了解业务数据的项目:

  • 数据集
  • 报表
  • 仪表板
  • 应用

可以使用数据流将从 Dataverse 导出到 Azure Data Lake Storage 的数据导入 Power BI。

数据集与数据流

数据流为可选,但数据集不是。 无法直接使用数据流,数据流填充数据集。

如不使用数据流并且仅使用数据集,则在每个数据集中重复执行数据集准备。 使用数据流时,数据流执行一次数据准备,然后每个数据集都使用预完成的准备。 数据流也可以包含计算实体,这些实体是报表所需的见解。

始终使用数据集,但可以选择对您有帮助的数据流。

Azure Synapse Link 服务可将 Dataverse 表数据连续复制到 Azure Data Lake Storage Gen 2 帐户或 Azure Synapse 工作区。 然后,您可以使用它运行分析,例如 Power BI 报表、Microsoft Azure 机器学习、数据仓库和其他集成方案。

导出到 Data Lake 的屏幕截图。

Azure Synapse Link 简化了导出表(用于分析)在技术和管理方面的复杂性。 客户只需进行一些简单的选择,就可以将其 Dataverse 环境链接到其 Azure 订阅中的数据池,然后选择表并将其导出到 Azure Data Lake Storage。 Dataverse 中所有数据和元数据的更改(初始和增量)会自动推送到 Azure Data Lake Gen 2,而无需执行更多操作。

数据会以 Common Data Model 格式存储,供 Power BI 和其他 Azure 分析服务使用。

企业 BI

提取数据以便在更广泛的企业报告工具中使用的企业 BI 具有许多优势:

  • 减少运营数据存储负载
  • 允许转换和历史分析
  • 允许用于来自其他来源的报告工具

下表显示了使用 Azure Synapse Link 从 Dataverse 中提取数据并填充 Power BI 等报表工具可以使用的工作区。

图中显示了 Azure Synapse Link 将数据复制到 ADLS Gen2 存储,并且 Power BI 连接到 Azure Synapse Analytics。

有关详细信息,请参阅 Power Platform 的 Power BI 建模指南