你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
数据治理概述
成功数据治理的关键是将结构化数据分解为数据实体和数据主题区域。 然后,你可以使用数据治理解决方案以人员、过程、策略和技术包围特定的数据实体和数据主题区域。 该解决方案可帮助你管理数据实体的生命周期。 在数据目录中的词汇表中建立通用的业务词汇也有助于管理数据。
数据目录技术至关重要。 如果不知道数据的位置或含义,则无法控制数据。 数据目录软件提供自动数据发现、用于确定数据质量的自动分析,以及自动敏感数据检测。 数据目录技术还有助于将不同的数据映射到目录的业务术语表中的常见词汇数据名称和定义,以了解数据的含义。
数据分类通过根据业务上下文分配数据资产的唯一逻辑标签或类来对数据资产进行分类。 分类标签或类的示例包括:
- 护照号码。
- 驾驶执照号。
- 信用卡编号。
- SWIFT 代码。
- 个人的姓名。
可以在数据目录中定义数据分类方案,例如 数据机密分类方案 。 若要定义方案,请将目录中的策略和规则与不同的分类级别相关联。
数据生命周期保留分类方案为数据生命周期管理提供了不同的保留分类。 自定义微服务生命周期应用程序可以使用此方案来维护环境中的数据生命周期。
使用机密性和保留分类标记业务术语表中的数据属性,以指定其治理。 在术语表中标记属性会自动定义如何控制映射到基础数据存储中的属性的数据。 数据目录将不同数据存储中的物理数据属性映射到业务术语表属性。
可以将多个技术与数据目录集成,以访问这些属性,并在分布式数据布局中的所有数据存储中强制实施策略和规则。 还可以将相同的分类标签应用于非结构化数据。
主数据实体很重要,因为它们的数据被广泛共享。 主数据实体通常与文档相关联。 客户和发票、供应商和合同以及资产和操作手册是示例主数据实体和文档配对。 通过使用这种类型的连接,可以使用主数据值(如供应商名称)标记相关文档,并保留结构化和非结构化数据之间的关系。
可以使用数据目录中的常用词汇数据实体创建创建受信任的数据资产的管道。 然后,可以在数据市场中发布这些资产以共享。
关键要点是,可以使用可用的数据治理方法来控制数据。 信任数据后,可以使用数据来驱动值。 组织和协调数据管理的方式决定了你的成功程度。
数据治理成熟度模型
数据治理成熟度模型描述了在数据环境中涵盖所有治理方面的能力的成熟度。 下表可帮助你评估数据治理成熟度模型中的当前位置。
人员
无治理 | 阶段 1 | 阶段 2 | 完全治理 |
---|---|---|---|
无利益干系人执行发起人 | 利益干系人发起人就位 | 利益干系人发起人就位 | 利益干系人发起人就位 |
无角色和职责 | 角色和职责已定义 | 角色和职责已定义 | 角色和职责已定义 |
无数据治理控制委员会 | 数据治理控制委员会就位,但没有任何数据 | 数据治理控制委员会就位,有数据 | 数据治理控制委员会就位,有数据 |
无数据治理工作组 | 无数据治理工作组 | 部分数据治理工作组就位 | 全部数据治理工作组就位 |
无数据所有者负责数据 | 无数据所有者负责数据 | 部分数据所有者就位 | 全部数据所有者就位 |
无指定数据专员负责数据质量 | 部分数据专员就位负责数据质量,但范围过大(例如整个部门) | 数据专员就位并分配到特定数据的数据治理工作组 | 数据专员就位并分配到特定数据的数据治理工作组 |
无人负责数据隐私 | 无人负责数据隐私 | 首席隐私官负责隐私(无工具) | 首席隐私官负责隐私(有工具) |
无人负责访问安全性 | IT 部门负责访问安全性 | IT 安全部门负责访问安全性 | IT 安全部门负责访问安全性并负责隐私措施的强制执行 |
无受信任的数据资产生成者 | 数据发布者已标识并负责生成受信任的数据 | 数据发布者已标识并负责生成受信任的数据 | 数据发布者已标识并负责生成受信任的数据 |
没有为数据实体识别的主题专家(SME) | 部分 SME 已标识,但未参与 | SME 已标识并加入数据治理工作组 | SME 已标识并加入数据治理工作组 |
过程
无治理 | 阶段 1 | 阶段 2 | 完全治理 |
---|---|---|---|
无通用业务词汇 | 已开始在词汇表中收集通用业务词汇 | 通用业务词汇已建立 | 常见业务词汇已完成和维护 |
无法知道数据位置、质量或敏感度 | 某些系统上的数据目录自动数据发现、分析和敏感数据检测 | 针对所有结构化数据的数据进行数据目录自动发现、分析和敏感数据检测 | 对所有系统中的结构化和非结构化数据进行数据目录自动发现、分析和敏感数据检测,以及完全自动标记 |
无治理策略和规则的创作或维护的过程 | 对部分系统上的数据访问安全、策略创作和维护的治理 | 数据访问安全性、隐私以及保留策略创作和维护的治理 | 数据访问安全性、隐私以及保留策略创作和维护的治理 |
无法强制执行策略和规则 | 不使用目录集成,跨系统逐段强制执行数据访问安全策略和规则 | 使用目录集成,跨系统强制执行数据访问安全策略和规则 | 跨全部系统强制执行数据访问安全性、隐私及保留策略和规则 |
无监视数据质量、数据隐私或数据访问安全性的过程 | 监视数据质量的一些功能、监视隐私的一些功能,例如查询 | 使用数据库管理系统 (DBMS) 掩码监视和管理核心系统上的数据质量和数据隐私 | 使用动态掩码,监视和管理全部系统的数据质量和数据隐私 |
无法获得完全受信任数据资产 | 使用数据结构软件为一小组受信任数据资产启动了开发 | 使用数据结构创建了数个核心受信任数据资产 | 通过企业数据市场持续交付受信任数据资产 |
不知道策略冲突是发生还是进程(如果发生) | 部分系统中的数据访问安全冲突检测 | 全部系统中的数据访问安全冲突检测 | 全部系统中的数据访问安全冲突检测 |
无漏洞测试过程 | 有限的漏洞测试过程 | 所有系统的漏洞测试过程 | 所有系统的漏洞测试过程 |
无通用过程用于创建、维护和同步主数据 | 具有常见主数据创建、读取、更新和删除(CRUD)和单个实体的同步过程的主数据管理(MDM) | 具有针对部分数据实体的通用主数据 CRUD 和同步过程的 MDM | 具有针对全部主数据实体的通用主数据 CRUD 和同步过程的 MDM |
策略
无治理 | 阶段 1 | 阶段 2 | 完全治理 |
---|---|---|---|
无关于保密性和保留的数据治理分类方案 | 针对保密性的数据治理分类方案 | 针对保密性以及保留的数据治理分类方案 | 针对保密性以及保留的数据治理分类方案 |
无治理数据质量的策略和规则 | 治理数据质量的策略和规则已在业务术语表的通用词汇中启用 | 用于管理目录业务词汇表中常见词汇表中定义的数据质量的策略和规则 | 用于管理目录业务词汇表中常见词汇表中定义的数据质量的策略和规则 |
无治理数据访问安全性的策略和规则 | 已在不同技术中创建部分治理数据访问安全性的策略和规则 | 用于管理使用分类方案合并的数据访问安全性的策略和规则 | 使用分类方案管理数据访问安全性的策略和规则在数据目录中合并,并在任何地方强制实施 |
无治理数据隐私的策略和规则 | 部分治理数据隐私的策略和规则 | 使用分类方案管理数据目录中合并的数据隐私的策略和规则 | 使用分类方案治理数据目录中合并的数据隐私的策略和规则,并在任何地方强制执行 |
无治理数据保留的策略和规则 | 部分治理数据保留的策略和规则 | 使用分类方案管理数据目录中合并的数据保留的策略和规则 | 策略和规则,用于使用分类方案管理数据目录中合并的数据保留,并随处强制执行 |
无治理主数据维护的策略和规则 | 针对单个主数据实体的治理主数据维护的策略和规则 | 针对部分主数据实体的治理主数据维护的策略和规则 | 针对全部主数据实体的治理主数据维护的策略和规则 |
技术
无治理 | 阶段 1 | 阶段 2 | 完全治理 |
---|---|---|---|
没有自动数据发现、分析和敏感数据检测的数据目录 | 使用自动数据发现、分析和敏感数据检测购买的数据目录 | 使用自动数据发现、分析和敏感数据检测购买的数据目录 | 使用自动数据发现、分析和敏感数据检测购买的数据目录 |
无具有多云边缘和数据中心连接的数据结构软件 | 已购买具有多云边缘和数据中心连接与目录集成的数据结构软件 | 已购买具有多云边缘和数据中心连接与目录集成的数据结构软件 | 已购买具有多云边缘和数据中心连接与目录集成的数据结构软件 |
无元数据世系 | 使用构造开发受信任资产的数据目录中提供的元数据世系 | 使用构造开发受信任资产的数据目录中提供的元数据世系 | 使用构造开发受信任资产的数据目录中提供的元数据世系 |
无数据管理工具 | 数据管理工具作为数据结构软件的一部分提供 | 数据管理工具作为数据结构软件的一部分提供 | 数据管理工具作为数据结构软件的一部分提供 |
无数据访问安全性工具 | 多种技术的数据访问安全性 | 多种技术的数据访问安全性 | 已在全部系统中强制执行数据访问安全性 |
无数据隐私强制执行软件 | 无数据隐私强制执行软件 | 部分数据库管理系统中存在数据隐私措施强制执行软件 | 全部数据存储中存在数据隐私措施强制执行软件 |
无 MDM 系统 | 单个实体 MDM 系统 | 多实体 MDM 系统 | 多实体 MDM 系统 |
数据治理成熟度摘要
确定当前在治理成熟度模型中所处的位置后,请与关键利益干系人会面,制定一个策略来增加成熟度。 首先定义要求、技术、数据质量、元数据、数据共享和主数据策略。