你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

将数据工厂连接到 Microsoft Purview

适用于: Azure 数据工厂 Azure Synapse Analytics

提示

试用 Microsoft Fabric 中的数据工厂,这是一种适用于企业的一站式分析解决方案。 Microsoft Fabric 涵盖从数据移动到数据科学、实时分析、商业智能和报告的所有内容。 了解如何免费开始新的试用

Azure Purview 是一项统一的数据治理服务,可帮助你管理和治理本地、多云和服务型软件 (SaaS) 数据。 可以将数据工厂连接到 Microsoft Purview。 通过该连接,可以使用 Microsoft Purview 来捕获世系数据,以及发现和探索 Microsoft Purview 资产。

将数据工厂连接到 Microsoft Purview

有两种方法可以将数据工厂连接到 Microsoft Purview:

在数据工厂中连接到 Microsoft Purview 帐户

你需要拥有数据工厂的“所有者”或“参与者”角色才能连接到 Microsoft Purview 帐户。 数据工厂需要启用系统分配的托管标识。

在数据工厂创作 UI 上建立连接:

  1. 在 ADF 创作 UI 中转到“管理”->“Microsoft Purview”,选择“连接到 Microsoft Purview 帐户”。

    Screenshot for registering a Microsoft Purview account.

  2. 选择“从 Azure 订阅中选择”或“手动输入” 。 从 Azure 订阅中,可以选择有权访问的帐户。

  3. 连接后,即可在“Microsoft Purview 帐户”选项卡中看到 Microsoft Purview 帐户的名称。

如果 Microsoft Purview 帐户受防火墙保护,请为 Microsoft Purview 创建托管专用终结点。 详细了解如何使数据工厂访问安全的 Microsoft Purview 帐户。 可在初始连接期间执行,也可稍后编辑现有连接。

Microsoft Purview 连接信息存储在数据工厂资源中,如下所示。 若要以编程方式建立连接,可以更新数据工厂并添加 purviewConfiguration 设置。 如果要从 SSIS 活动推送世系,还需要额外添加 catalogUri 标记。

{
    "name": "ContosoDataFactory",
    "type": "Microsoft.DataFactory/factories",
    "location": "<region>",
    "properties": {
        ...
        "purviewConfiguration": {
            "purviewResourceId": "/subscriptions/<subscriptionId>/resourceGroups/<resourceGroupname>/providers/Microsoft.Purview/accounts/<PurviewAccountName>"
        }
    },
    ...
    "identity": {...},
    "tags": {
        "catalogUri": "<PurviewAccountName>.purview.azure.com/catalog //Note: used for SSIS lineage only"
    }
}

在 Microsoft Purview 中注册数据工厂

若要了解如何在 Microsoft Purview 中注册数据工厂,请参阅如何连接 Azure 数据工厂和 Microsoft Purview

设置身份验证

数据工厂的托管标识用于对从数据工厂到 Microsoft Purview 的世系数据推送操作进行身份验证。

向数据工厂的托管标识授予 Microsoft Purview 根集合的“数据策展人”角色。 详细了解 Microsoft Purview 中的访问控制添加角色并限制通过集合的访问

在创作 UI 上将数据工厂连接到 Microsoft Purview 时,ADF 会尝试自动添加此类角色分配。 如果你拥有 Microsoft Purview 根集合的“集合管理员”角色,并且可从你的网络访问 Microsoft Purview 帐户,则此操作成功完成。

监视icrosoft Purview 连接

将数据工厂连接到 Microsoft Purview 帐户后,会看到以下页面,其中包含有关已启用的集成功能的详细信息。

Screenshot for monitoring the integration status between Azure Data Factory and Microsoft Purview.

对于“数据世系 - 管道”,你可能会看到以下状态之一:

  • 已连接:数据工厂已成功连接到 Microsoft Purview 帐户。 请注意,这表示数据工厂与 Microsoft Purview 帐户关联并且有权向其推送世系。 如果 Microsoft Purview 帐户受防火墙保护,则还需确保用于执行活动和进行世系推送的集成运行时可以访问 Microsoft Purview 帐户。 有关详细信息,请参阅从 Azure 数据工厂访问受保护的 Microsoft Purview 帐户

  • 已断开连接:数据工厂无法将世系推送到 Microsoft Purview,因为尚未将“Microsoft Purview 数据管护者”角色授予数据工厂的托管标识。 若要解决此问题,请转到 Microsoft Purview 帐户以检查角色分配,并根据需要手动授予该角色。 有关详细信息,请参阅设置身份验证部分。

  • 未知:数据工厂无法检查状态。 可能的原因包括:

    • 无法从当前网络访问 Microsoft Purview 帐户,因为该帐户受防火墙保护。 可以改为从已连接到 Microsoft Purview 帐户的专用网络启动 ADF UI。
    • 你无权检查 Microsoft Purview 帐户上的角色分配。 可以联系 Microsoft Purview 帐户管理员来为你检查角色分配。 若要了解所需的 Microsoft Purview 角色,请参阅设置身份验证部分。

向 Microsoft Purview 报告世系数据

将数据工厂连接到 Microsoft Purview 帐户后,执行管道时,数据工厂会向 Microsoft Purview 帐户推送世系信息。 有关受支持功能的详细信息,请参阅支持的 Azure 数据工厂活动。 有关端到端演练,请参阅教程:将数据工厂世系数据推送到 Microsoft Purview

使用 Microsoft Purview 发现和探索数据

将数据工厂连接到 Microsoft Purview 帐户后,可以使用数据工厂创作 UI 顶部中央的搜索栏来搜索数据并执行操作。 有关详细信息,请参阅使用 Microsoft Purview 发现和探索 ADF 中的数据

教程:将数据工厂世系数据推送到 Microsoft Purview

使用 Microsoft Purview 发现和探索 ADF 中的数据

访问受保护的 Microsoft Purview 帐户