你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

在数据网格中管理主数据

使用数据网格架构的企业通常拥有大量域,每个域都包含独特的系统和数据。

这种广泛分布的数据增加了复杂性,因为此设置中可能存在相同数据的多个版本。 集成需要执行更多的工作,因为所有者必须集成和协调来自多个域的相同数据的所有不同部分。 在这些不同域之间的上下文中,数据可能不一致。 数据质量也可能有所不同。 应用主数据管理 (MDM) 来解决这些挑战。

面向域的主数据管理

主标识号是 MDM 的一个重要方面。 主标识号将主数据与你的域中的数据链接在一起。 这些数字对于跟踪哪些数据已被掌握以及哪些数据属于一起的能力至关重要。 只能集中识别唯一数据并分配主标识号,而不能在系统内本地分配。 来自不同系统的主数据必须在 MDM 解决方案中集中在一起。

MDM 在面向域的体系结构中的工作方式不同,因为它具有分布式性质。 由于你依赖于域中的 MDM,因此很难实现一致性。

实现一致性的一种方法是要求域在分发数据产品时符合集中管理的主数据。 可以在主数据存储或中央存储库中发布主数据列表。 在跨其他域分发数据产品时,域可以使用企业引用数据的企业引用标识符对数据进行分类。 这样,其他域就可以快速识别这些数据产品中的任何主数据。

主数据管理域

在对 MDM 活动进行分组并将主数据存储用作集中存储库时,还可以创建新的 MDM 域。 每个新的 MDM 域都应包含一个特定的数据主体,主数据的识别和控制重点关注该数据主体。 该数据的一些著名示例包括客户、产品、员工、地理位置以及财务和风险信息。 来自这些 MDM 域的已掌握数据必须找到回其他域的方式。 此数据分布类似于数据产品的分布。

你可以限定主数据管理范围,并允许采用不同的数据产品分发方法。 在一定范围限制内,数据产品不一定要符合企业主数据,但如果超出此范围限制,数据产品必须要符合企业主数据。 也可以反向应用此模式,要求仅在特定范围内(而非超出范围)遵循主数据。 在这些设置中,主数据在 MDM 解决方案中集中管理。 你的域需要交换主数据,这样他们知道要映射到中心主数据的本地数据。 识别和维护这些关系,以便知道已掌握哪些数据,以及哪些数据可以快速链接在一起。 如果操作系统中的本地域密钥发生更改,主标识符是唯一一个将所有内容绑定在一起的元素。

分发主标识符时,不要将 MDM 主标识符外推到所有源系统。 这样做可能导致一致性问题。 只有受 MDM 约束的应用程序或系统应从 MDM 中心获取主标识符。 不受 MDM 约束的系统应使用它们自己的本地(域)完整性。

域级主数据管理

查找重叠数据时,你可能会发现不同程度的重叠。 某些数据是泛型的,跨越多个域。 其他数据存在有限的重叠,仅跨越几个域。 通过将 MDM 扩展到域级 MDM 来区分数据重叠的数量及其重要性。 你可以通过在特定范围内创建主数据的部分视图来做到这一点。 当数据在你的部分(但不是全部)域之间共享时,这很有用。

域级主数据管理

确保重叠域管理数据但没有集中依赖项,这一点非常重要。 MDM 解决方案可以帮助你实现此目的。 可以通过抽象化基础结构并为域提供 MDM 即服务来大大简化使用。 如果使用中央解决方案,请为每个单独的域或范围应用隔离视图。

实现可重用组件的一致性

代码共享是确保主数据协作和可重用性的另一种方法。 无需共享主数据,而是共享基础代码(片段和脚本)以生成输出并促进有效重用。 将此基础代码存储在具有版本控制的中央和打开的存储库中。 你的团队都可以为此存储库中的代码做出贡献和改进。

在此模型中,仅在域中应用业务逻辑。 团队可以根据需要,偏离、改进或使用逻辑的略微优化版本。 随着来自社区的改进被添加到中央代码存储库中,可以重新生成输出。

请注意,允许团队修改他们的代码会使比较不同团队之间的结果变得更加困难,这可能会影响一致性。

主数据管理总结

只有当用户使用的数据一致且正确时,他们才能做出正确的决定。 通过使用 MDM,可以确保数据在企业级的一致性和质量。

你的组织必须找到 MDM 的正确平衡。 拥有过多的主数据或参考值区域会导致过多的跨域对齐。 如果根本没有企业数据,则无法比较任何结果。 以平衡的方式开始使用 MDM 的一种实用方法是实现存储库。 这是管理组织主数据的最简单方法。 使用存储库,无需调整域系统即可了解哪些数据质量低下或需要对齐。 存储库可以帮助你获取该信息,更快地提供价值。

实现存储库后,需要确定清晰的范围。 不要选择所有数据,从而陷入企业数据统一的陷阱。 仅来自最重要字段的主数据。 首先选择添加最大价值的主题,例如客户、合同、产品和组织单位。 属性数目应该为几十个,而不是几百个或几千个。

与你的域达成协议后,协调流程和治理。 对所有域明确有关时间线和评审的协议。 此外,请确保处理元数据。 编录主数据。 确保域知道哪些数据元素是来自哪些源系统的候选项,以及这些元素如何流经数据管道。

最后一步,最终的目标是实现共存。 改进应直接流回域。 这是该过程中最困难的部分,因为它要求进行许多体系结构更改。 域需要能够处理从集中管理的 MDM 解决方案发送的更正和改进。

后续步骤