在 Microsoft Purview 中连接和管理 PostgreSQL

本文概述了如何注册 PostgreSQL,以及如何在 Microsoft Purview 中对 PostgreSQL 进行身份验证和交互。 有关 Microsoft Purview 的详细信息,请阅读 介绍性文章

支持的功能

元数据提取 完整扫描 增量扫描 作用域扫描 分类 标记 访问策略 血统 数据共享 实时视图

支持的 PostgreSQL 服务器版本为 8.4 到 12.x。

扫描 PostgreSQL 源时,Microsoft Purview 支持:

  • 提取技术元数据,包括:

    • 服务器
    • Databases
    • Schemas
    • 包含列的表
    • 包含列的视图
  • 提取表和视图之间的资产关系的静态世系。

设置扫描时,可以选择扫描整个 PostgreSQL 数据库,或将扫描范围限定为与给定名称 () 或名称模式 () 匹配的架构子集。

已知限制

从数据源中删除对象时,当前后续扫描不会自动删除 Microsoft Purview 中的相应资产。

先决条件

注意

如果数据存储不可公开访问 (如果数据存储限制从本地网络、专用网络或特定 IP 等 ) 的访问, 则需要配置自承载集成运行时才能连接到它

扫描所需的权限

PostgreSQL 用户必须具有对系统表的读取访问权限才能访问高级元数据。

注册

本部分介绍如何使用 Microsoft Purview 治理门户在 Microsoft Purview 中注册 PostgreSQL。

注册步骤

若要在数据目录中注册新的 PostgreSQL 源,请执行以下步骤:

  1. 在 Microsoft Purview 治理门户中导航到 Microsoft Purview 帐户。
  2. 在左侧导航中选择“ 数据映射 ”。
  3. 选择 “注册”
  4. 在“注册源”上,选择“ PostgreSQL”。 选择 继续

“注册源 (PostgreSQL) ”屏幕上,按照以下步骤操作:

  1. 输入数据源将在目录中列出的 名称

  2. 输入 服务器 名称以连接到 PostgreSQL 源。 这可以是:

    • 用于连接到数据库服务器的主机名。 例如:MyDatabaseServer.com
    • IP 地址。 例如:192.169.1.2
  3. 对于 PostgreSQL) ,输入用于默认连接到数据库服务器的 端口 (5432。

  4. 选择集合或创建新集合 (可选)

  5. 完成以注册数据源。

    注册源选项

扫描

按照以下步骤扫描 PostgreSQL 以自动标识资产。 有关一般扫描的详细信息,请参阅 扫描和引入简介

扫描身份验证

PostgreSQL 源支持的身份验证类型为 基本身份验证

创建并运行扫描

若要创建并运行新的扫描,请执行以下步骤:

  1. 如果服务器可公开访问,请跳到步骤 2。 否则,需要确保已配置自承载集成运行时:

    1. Microsoft Purview 治理门户中,转到管理中心,然后选择“ 集成运行时”。
    2. 确保自承载集成运行时可用。 如果未设置,请使用 此处 提到的步骤设置自承载集成运行时。
  2. Microsoft Purview 治理门户中,导航到 “源”。

  3. 选择已注册的 PostgreSQL 源。

  4. 选择“ + 新建扫描”。

  5. 提供以下详细信息:

    1. 名称:扫描的名称

    2. 通过集成运行时进行连接:如果服务器可公开访问,请选择 Azure 自动解析的集成运行时;如果配置的自承载集成运行时未公开可用,请选择该运行时。

    3. 凭据:选择要连接到数据源的凭据。 请确保:

      • 创建凭据时选择“ 基本身份验证 ”。
      • 在“用户名”输入字段中提供用于连接到数据库服务器的用户名。
      • 将用于连接到数据库服务器的用户密码存储在密钥中。
    4. 数据库:指定要导入的数据库实例的名称。

    5. 架构:列出要导入的架构子集,表示为分号分隔列表。 例如,schema1; schema2。 如果该列表为空,则导入所有用户架构。 所有系统架构 (例如,默认情况下,SysAdmin) 和 对象将被忽略。

      使用 SQL LIKE 表达式语法的可接受架构名称模式包括使用 %。 例如:A%; %B; %C%; D

      • 从 A 或 开始
      • 以 B 或 结尾
      • 包含 C 或
      • 等于 D

      不能接受使用 NOT 和特殊字符。

    6. 使用自承载集成运行时) 时,最大可用内存 (适用:扫描进程) 客户 VM 上可用的最大内存 ((GB)。 这取决于要扫描的 PostgreSQL 源的大小。

      注意

      作为经验法则,请为每 1000 个表提供 1GB 内存

      扫描 PostgreSQL

  6. 选择“测试连接”以验证使用 Azure Integration Runtime) 时可用的设置 (。

  7. 选择 继续

  8. 选择 扫描触发器。 可以设置计划或运行扫描一次。

  9. 查看扫描并选择“ 保存并运行”。

查看扫描和扫描运行

查看现有扫描:

  1. 转到 Microsoft Purview 治理门户。 在左窗格中,选择“ 数据映射”。
  2. 选择数据源。 可以在“最近扫描”下查看该数据源上的现有 扫描列表,也可以在“扫描”选项卡上查看所有 扫描
  3. 选择要查看的结果的扫描。 窗格显示之前的所有扫描运行,以及每个扫描运行的状态和指标。
  4. 选择运行 ID 以检查扫描运行详细信息

管理扫描

若要编辑、取消或删除扫描,请执行以下操作:

  1. 转到 Microsoft Purview 治理门户。 在左窗格中,选择“ 数据映射”。

  2. 选择数据源。 可以在“最近扫描”下查看该数据源上的现有 扫描列表,也可以在“扫描”选项卡上查看所有 扫描

  3. 选择要管理的扫描。 然后,可以:

    • 通过选择“编辑扫描 ”来编辑扫描
    • 选择“取消扫描运行”, 取消正在进行的扫描
    • 通过选择“删除扫描” 来删除扫描

注意

  • 删除扫描不会删除从以前的扫描创建的目录资产。
  • 如果源表已更改,并且你在 Microsoft Purview 的“ 架构 ”选项卡上编辑说明后重新扫描源表,则资产将不再使用架构更改进行更新。

血统

扫描 PostgreSQL 源后,可以 浏览数据目录搜索数据目录 以查看资产详细信息。

转到“资产 -> 世系”选项卡,可以看到资产关系(如果适用)。 有关支持的 PostgreSQL 世系方案,请参阅支持 的功能 部分。 有关世系的一般信息,请参阅 数据世系世系用户指南

PostgreSQL 世系视图

后续步骤

注册源后,请按照以下指南详细了解 Microsoft Purview 和数据。