使用 Apache Spark 转换 Azure Synapse Link for Dataverse 数据
您可以使用 Azure Synapse Link 将 Microsoft Dataverse 数据连接到 Azure Synapse Analytics,以探索数据并加快获得见解的速度。 本文演示如何使用 Synapse 工作区中可用的 Apache Spark 引擎转换 Dataverse 数据。
备注
Azure Synapse Link for Microsoft Dataverse 以前称为“导出到 Data Lake”。 此服务已更名,从 2021 年 5 月起生效,它会继续将数据导出到 Azure Data Lake 以及 Azure Synapse Analytics。
先决条件
本节介绍在使用 Azure Synapse Link for Dataverse 服务后使用 Apache Spark 转换 Dataverse 数据所需的先决条件。
Azure Synapse Link for Dataverse。 本指南假设您已经使用 Azure Synapse Link for Dataverse 从 Dataverse 导出了数据。
存储帐户访问。 您必须被授予存储帐户的以下角色之一:存储 Blob 数据读取者、存储 Blob 数据参与者或存储 Blob 数据负责人。
Synapse 管理员。 您必须在 Synapse Studio 中被授予 Synapse 管理员角色访问权限。
使用 Apache Spark 笔记本转换您的数据
在 Power Apps 中,从列表中选择所需的 Azure Synapse Link,然后选择转到 Azure Synapse workspace。
展开数据库,选择 Dataverse 容器。 您导出的表将显示在左侧边栏的表目录下。
右键单击所需的表,然后选择新笔记本 > 加载至 DataFrame。
通过从下拉菜单中选择一个池,将笔记本附加到 Apache Spark 池。 如果您没有 Apache Spark 池,请选择管理池以创建一个池。
添加代码单元格以转换数据。 通过选择每个单元格左侧的播放按钮来运行单个单元格,或者通过从顶部栏中选择全部运行来连续运行所有单元格。