为 Fabric 镜像数据库设置数据质量

作为一种数据复制解决方案,Fabric 中的镜像是一种低成本、低延迟的解决方案,用于将各种系统中的数据汇集到单个分析平台中。 可以连续将现有数据资产直接复制到 Fabric 的 OneLake 中,包括来自 Azure SQL Database、Azure Cosmos DB 和 Snowflake 的数据。

Fabric 中的镜像允许用户享受旨在简化分析需求的端到端产品。 镜像是一种低成本、低延迟的解决方案,可用于在 OneLake 中创建数据副本 (replica) ,使其随时满足所有分析需求。 有关 Fabric 镜像的更多详细信息 ,请浏览 Fabric 文档

配置 Fabric 镜像数据库的数据质量

  1. 在 Fabric 租户中启用镜像。 Power BI 管理员可以使用 Power BI 管理门户中的设置为整个组织或特定安全组启用或禁用镜像。 通过创建与作数据源的安全连接来启用镜像。 选择是复制整个数据库还是单个表,镜像会自动使数据保持同步。设置后,数据将持续复制到 OneLake 中以供分析使用。

  2. 启用镜像并启动复制后,确认镜像复制成功完成。

  3. 打开 SQL 分析终结点

    用于导航 sql 终结点的屏幕截图。

  4. 在“ 报告 ”选项卡上,选择“ 自动更新语义模型”。

    自动更新语义模型。

  5. 如果未创建 Lakehouse,请在 Fabric 工作区中创建一个。

  6. 创建从该镜像数据库到 lakehouse 的 Fabric 快捷方式。

  7. 转到Microsoft Purview 数据映射并在该 lakehouse 上运行数据映射扫描;忽略镜像数据库。 使用服务主体身份验证。

    使用服务主体进行数据映射扫描。

  8. 扫描完成后, 将 lakehouse 表) (新的数据资产与数据产品相关联。 请确保选择要与数据产品关联的 Lakehouse 表

  9. 将镜像表作为 Lakehouse 表 关联到数据产品后,可以将所有镜像表的数据质量分析并测量为 Microsoft Purview 中的 Lakehouse 表。

  10. 在 统一目录 的 Heath 管理的数据质量区域中,像往常一样运行数据质量扫描分析数据

重要

  • 使用服务主体进行数据映射扫描,并使用托管标识进行数据质量扫描。
  • 选择镜像数据库,而不是单个表。
  • 每次向镜像数据库添加新表时更新语义模型。
  • 如果镜像数据库表在 Fabric Lakehouse 中不可用,请联系 Fabric 支持人员。
  • 仅 Lakehouse delta、Iceberg 和 Parquet 文件格式支持数据质量扫描。