在 Microsoft Purview 中连接和管理 Db2

本文概述了如何注册 Db2,以及如何在 Microsoft Purview 中对 Db2 进行身份验证和交互。 有关 Microsoft Purview 的详细信息,请阅读 介绍性文章

支持的功能

元数据提取 完整扫描 增量扫描 作用域扫描 分类 标记 访问策略 血统 数据共享 实时视图

支持的 IBM Db2 版本是 DB2 for LUW 9.7 到 11.x。 目前不支持 db2 for z/OS (大型机) 和 iSeries (AS/400) 。

扫描 IBM Db2 源时,Microsoft Purview 支持:

  • 提取技术元数据,包括:

    • 服务器
    • Databases
    • Schemas
    • 包含列、外键、索引和约束的表
    • 包含列的视图
    • 触发器
  • 提取表和视图之间的资产关系的静态世系。

可以扫描整个 Db2 数据库,或将扫描范围限定为与给定名称或名称模式匹配的子集。

已知限制

从数据源中删除对象时,当前后续扫描不会自动删除 Microsoft Purview 中的相应资产。

先决条件

  • 具有活动订阅的 Azure 帐户。 免费创建帐户

  • 有效的 Microsoft Purview 帐户

  • 需要数据源管理员和数据读取者权限才能在 Microsoft Purview 治理门户中注册和管理源。 有关权限的详细信息,请参阅 Microsoft Purview 中的访问控制

  • 设置最新的 自承载集成运行时。 有关详细信息,请参阅 创建和配置自承载集成运行时指南。 支持的最低自承载Integration Runtime版本为 5.12.7984.1。

    • 确保在安装了自承载集成运行时的计算机上安装 了 JDK 11 。 在新安装 JDK 后重启计算机,使其生效。

    • 确保在自承载集成运行时计算机上安装Visual C++ 可再发行程序包 (版本 Visual Studio 2012 Update 4 或更高版本) 。 如果未安装此更新, 可以在此处下载

    • 在运行自承载集成运行时的计算机上下载 Db2 JDBC 驱动程序 。 记下用于设置扫描的文件夹路径。

      注意

      自承载集成运行时应可以访问驱动程序。 默认情况下,自承载集成运行时使用本地服务帐户“NT SERVICE\DIAHostService”。 确保它具有驱动程序文件夹的“读取和执行”和“列出文件夹内容”权限。

  • Db2 用户必须具有 CONNECT 权限。 导入元数据时,Microsoft Purview 会连接到 IBM Db2 环境中的 syscat 表。

注册

本部分介绍如何使用 Microsoft Purview 治理门户在 Microsoft Purview 中注册 Db2。

注册步骤

若要在数据目录中注册新的 Db2 源,请执行以下步骤:

  1. 在 Microsoft Purview 治理门户中导航到 Microsoft Purview 帐户。
  2. 在左侧导航中选择“ 数据映射 ”。
  3. 选择 “注册”
  4. 在“注册源”上,选择“ Db2”。 选择 继续

“ (Db2) 注册源 ”屏幕上,执行以下步骤:

  1. 输入数据源将在目录中列出的 名称

  2. 输入要连接到 Db2 源 的服务器 名称。 此名称可以是:

    • 用于连接到数据库服务器的主机名。 例如:MyDatabaseServer.com
    • IP 地址。 例如:192.169.1.2
  3. 对于 Db2) ,输入用于连接到数据库服务器的 端口 (默认为 446。

  4. 选择集合或创建新集合 (可选)

  5. 完成以注册数据源。

    注册源选项

扫描

按照步骤扫描 Db2 以自动标识资产。 有关一般扫描的详细信息,请参阅 扫描和引入简介

扫描身份验证

Db2 源支持的身份验证类型为 “基本身份验证”。

创建并运行扫描

若要创建并运行新的扫描,请执行以下步骤:

  1. 在“管理中心”中,选择“集成运行时”。 确保已设置自承载集成运行时。 如果未设置,请使用 此处 提到的步骤创建自承载集成运行时。

  2. 导航到 “源”。

  3. 选择已注册的 Db2 源。

  4. 选择“ + 新建扫描”。

  5. 提供以下详细信息:

    1. 名称:扫描的名称

    2. 通过集成运行时进行连接:选择配置的自承载集成运行时

    3. 凭据:选择要连接到数据源的凭据。 请确保:

      • 创建凭据时选择“ 基本身份验证 ”。
      • 在“用户名”输入字段中提供用于连接到数据库服务器的用户名。
      • 将用于连接到数据库服务器的用户密码存储在密钥中。
    4. 数据库:要导入的数据库实例的名称。

    5. 架构:列出要导入的架构子集,表示为分号分隔列表。 例如,schema1; schema2。 如果该列表为空,则导入所有用户架构。 所有系统架构 (例如,默认情况下,SysAdmin) 和 对象将被忽略。

      使用 SQL LIKE 表达式语法的可接受架构名称模式包括使用 %。 例如:A%; %B; %C%; D

      • 从 A 或 开始
      • 以 B 或 结尾
      • 包含 C 或
      • 等于 D

      不能接受使用 NOT 和特殊字符。

    6. 驱动程序位置:指定运行自主机集成运行时的计算机中的 JDBC 驱动程序位置的路径, D:\Drivers\Db2例如 。 它是有效 JAR 文件夹位置的路径。 请确保自承载集成运行时可以访问驱动程序,有关详细信息,请参阅 先决条件部分

    7. 最大可用内存:最大内存 ((以 GB 为单位),) 客户 VM 上可供扫描进程使用。 所需的内存取决于要扫描的 Db2 源的大小。

      注意

      作为经验法则,请为每 1000 个表提供 1GB 内存

      扫描 Db2

  6. 选择 继续

  7. 选择 扫描触发器。 可以设置计划或运行扫描一次。

  8. 查看扫描并选择“ 保存并运行”。

查看扫描和扫描运行

查看现有扫描:

  1. 转到 Microsoft Purview 治理门户。 在左窗格中,选择“ 数据映射”。
  2. 选择数据源。 可以在“最近扫描”下查看该数据源上的现有 扫描列表,也可以在“扫描”选项卡上查看所有 扫描
  3. 选择要查看的结果的扫描。 窗格显示之前的所有扫描运行,以及每个扫描运行的状态和指标。
  4. 选择运行 ID 以检查扫描运行详细信息

管理扫描

若要编辑、取消或删除扫描,请执行以下操作:

  1. 转到 Microsoft Purview 治理门户。 在左窗格中,选择“ 数据映射”。

  2. 选择数据源。 可以在“最近扫描”下查看该数据源上的现有 扫描列表,也可以在“扫描”选项卡上查看所有 扫描

  3. 选择要管理的扫描。 然后,可以:

    • 通过选择“编辑扫描 ”来编辑扫描
    • 选择“取消扫描运行”, 取消正在进行的扫描
    • 通过选择“删除扫描” 来删除扫描

注意

  • 删除扫描不会删除从以前的扫描创建的目录资产。
  • 如果源表已更改,并且你在 Microsoft Purview 的“ 架构 ”选项卡上编辑说明后重新扫描源表,则资产将不再使用架构更改进行更新。

血统

扫描 Db2 源后,可以 浏览数据目录搜索数据目录 以查看资产详细信息。

转到“资产 -> 世系”选项卡,可以看到资产关系(如果适用)。 有关支持的 Db2 世系方案,请参阅支持 的功能 部分。 有关世系的一般信息,请参阅 数据世系世系用户指南

后续步骤

注册源后,请按照以下指南详细了解 Microsoft Purview 和数据。