读取 Dataverse 数据的增量更新
使用 Azure Synapse Link for Dataverse 创建从 Microsoft Dataverse 到 Synapse 工作区的连续数据管道后,您可以读取指定时间间隔的增量更新。 使用 Azure Synapse Link for Dataverse 导出的每个 Dataverse 表都包含一个 SinkModifiedOn 列,此列可用于获取增量更新。
备注
Azure Synapse Link for Microsoft Dataverse 以前称为“导出到 Data Lake”。 此服务已更名,从 2021 年 5 月起生效,它会继续将数据导出到 Azure Data Lake 以及 Azure Synapse Analytics。
先决条件
本节介绍读取导出的 Dataverse 数据增量更新所需的先决条件。
Azure Synapse Link for Dataverse。 本指南假定已使用 Azure Synapse Link for Dataverse 从 Dataverse 中导出了数据,并且所有表都将使用仅追加模式进行同步。
存储帐户访问。 您必须被授予存储帐户的以下角色之一:存储 Blob 数据读取者、存储 Blob 数据参与者或存储 Blob 数据负责人。
Synapse 管理员。 您必须在 Synapse Studio 中被授予 Synapse 管理员角色访问权限。
读取 Dataverse 数据的增量更新
导航到您的 Azure Synapse Analytics 工作区。
从左侧面板选择开发,然后选择 + > SQL 脚本。
粘贴以下 SQL 查询,并将 CONTAINER_NAME 替换为容器的名称,将 TABLE_NAME 替换为 Dataverse 表的名称,将 TIMESTAMP_START 和 TIMESTAMP_END 替换为 UTC 格式的时间间隔 (YYYY-MM-DDTHH:MM:SS)。
SELECT * FROM [CONTAINER_NAME].[dbo].[TABLE_NAME] WHERE [SinkModifiedOn] >= TIMESTAMP_START AND [SinkModifiedOn] <= TIMESTAMP_END
运行此查询,系统将显示一个包含从指定时间间隔对 Dataverse 表进行增量更新的表。