在 Microsoft Purview 中连接和管理 Salesforce

本文概述了如何注册 Salesforce,以及如何在 Microsoft Purview 中对 Salesforce 进行身份验证和交互。 有关 Microsoft Purview 的详细信息,请阅读 介绍性文章

支持的功能

元数据提取 完整扫描 增量扫描 作用域扫描 分类 标记 访问策略 血统 数据共享 实时视图

扫描 Salesforce 源时,Microsoft Purview 支持提取技术元数据,包括:

  • 组织
  • 对象,包括字段、外键和unique_constraints

设置扫描时,可以选择扫描整个 Salesforce 组织,或将扫描范围限定为与给定名称 () 或名称模式 () 匹配的对象子集。

已知限制

从数据源中删除对象时,当前后续扫描不会自动删除 Microsoft Purview 中的相应资产。

先决条件

注意

如果数据存储不可公开访问 (如果数据存储限制从本地网络、专用网络或特定 IP 等 ) 的访问, 则需要配置自承载集成运行时才能连接到它

扫描所需的权限

如果用户将提交 Salesforce 文档,则必须将某些安全设置配置为允许对标准对象和自定义对象进行此访问。 配置权限:

  • 在 Salesforce 中,选择“设置”,然后选择“管理用户”。
  • 在“管理用户”树下,选择“配置文件”。
  • 在右侧显示配置文件后,选择要编辑的配置文件,然后选择相应配置文件旁边的“编辑”链接。

对于“标准对象”,请确保“文档”部分选择了“读取”权限。 对于“自定义对象”,请确保为每个自定义对象选择了“读取”权限。

注册

本部分介绍如何使用 Microsoft Purview 治理门户在 Microsoft Purview 中注册 Salesforce。

注册步骤

若要在数据目录中注册新的 Salesforce 源,请执行以下步骤:

  1. 在 Microsoft Purview 治理门户中导航到 Microsoft Purview 帐户。
  2. 在左侧导航中选择“ 数据映射 ”。
  3. 选择 “注册”
  4. 在“注册源”上,选择“ Salesforce”。 选择 继续

“ (Salesforce) 注册源 ”屏幕上,按照以下步骤操作:

  1. 输入数据源将在目录中列出的 名称

  2. 输入 Salesforce 登录终结点 URL 作为 域 URL。 例如,https://login.salesforce.com。 可以使用公司的实例 URL ((如 https://na30.salesforce.com) )或“我的域 URL” ((如 https://myCompanyName.my.salesforce.com/) )。

  3. 选择集合或创建新集合 (可选)

  4. 完成以注册数据源。

    注册源选项

扫描

按照以下步骤扫描 Salesforce 以自动识别资产。 有关一般扫描的详细信息,请参阅 扫描和引入简介

Microsoft Purview 使用 Salesforce REST API 版本 41.0 提取元数据, 包括 REST 请求,如 “描述全局” URI (/v41.0/sobjects/) ,'sObject Basic Information' URI (/v41.0/sobjects/sObject/) ,以及 'SOQL Query' URI (/v41.0/query?) 。

扫描身份验证

Salesforce 源支持的身份验证类型为 使用者密钥身份验证

创建并运行扫描

若要创建并运行新的扫描,请执行以下步骤:

  1. 如果服务器可公开访问,请跳到步骤 2。 否则,需要确保已配置自承载集成运行时:

    1. Microsoft Purview 治理门户中,转到管理中心,然后选择“ 集成运行时”。
    2. 确保自承载集成运行时可用。 如果未设置,请使用 此处 提到的步骤设置自承载集成运行时。
  2. Microsoft Purview 治理门户中,导航到 “源”。

  3. 选择已注册的 Salesforce 源。

  4. 选择“ + 新建扫描”。

  5. 提供以下详细信息:

    1. 名称:扫描的名称

    2. 通过集成运行时进行连接:如果服务器可公开访问,请选择 Azure 自动解析的集成运行时;如果配置的自承载集成运行时未公开可用,请选择该运行时。

    3. 凭据:选择要连接到数据源的凭据。 请确保:

      • 创建凭据时选择“ 使用者密钥 ”。
      • 在“用户名”输入字段中提供 所连接应用 正在模仿的用户用户名。
      • 将已连接应用正在模拟的用户的密码存储在 Azure 密钥保管库 机密中。
        • 如果自承载集成运行时计算机的 IP 在 Salesforce 上为组织设置的 受信任 IP 范围内 ,请仅提供用户的密码。
        • 否则, 请将密码和安全令牌连接为机密的值。 安全令牌是自动生成的密钥,在从不受信任的网络登录到 Salesforce 时,必须将其添加到密码末尾。 详细了解如何 获取或重置安全令牌
      • 从连接的应用定义中提供使用者密钥。 可以在连接的应用的“管理连接应用”页或已连接应用的定义中找到它。
      • 将连接的应用定义的使用者密码存储在 Azure 密钥保管库 机密中。 你可以找到它以及使用者密钥。
    4. 对象:提供对象名称列表以限定扫描范围。 例如,object1; object2。 空列表意味着检索所有可用对象。 可以将对象名称指定为通配符模式。 例如,topic?*topic*topic_?,*topic*

    5. 使用自承载集成运行时) 时,最大可用内存 (适用:扫描进程) 客户 VM 上可用的最大内存 ((GB)。 这取决于要扫描的 Salesforce 源的大小。

      注意

      作为经验法则,请为每 1000 个表提供 1GB 内存

      扫描 Salesforce

  6. 选择“测试连接”以验证使用 Azure Integration Runtime) 时可用的设置 (。

  7. 选择 继续

  8. 选择 扫描触发器。 可以设置计划或运行扫描一次。

  9. 查看扫描并选择“ 保存并运行”。

查看扫描和扫描运行

查看现有扫描:

  1. 转到 Microsoft Purview 治理门户。 在左窗格中,选择“ 数据映射”。
  2. 选择数据源。 可以在“最近扫描”下查看该数据源上的现有 扫描列表,也可以在“扫描”选项卡上查看所有 扫描
  3. 选择要查看的结果的扫描。 窗格显示之前的所有扫描运行,以及每个扫描运行的状态和指标。
  4. 选择运行 ID 以检查扫描运行详细信息

管理扫描

若要编辑、取消或删除扫描,请执行以下操作:

  1. 转到 Microsoft Purview 治理门户。 在左窗格中,选择“ 数据映射”。

  2. 选择数据源。 可以在“最近扫描”下查看该数据源上的现有 扫描列表,也可以在“扫描”选项卡上查看所有 扫描

  3. 选择要管理的扫描。 然后,可以:

    • 通过选择“编辑扫描 ”来编辑扫描
    • 选择“取消扫描运行”, 取消正在进行的扫描
    • 通过选择“删除扫描” 来删除扫描

注意

  • 删除扫描不会删除从以前的扫描创建的目录资产。
  • 如果源表已更改,并且你在 Microsoft Purview 的“ 架构 ”选项卡上编辑说明后重新扫描源表,则资产将不再使用架构更改进行更新。

后续步骤

注册源后,请按照以下指南详细了解 Microsoft Purview 和数据。