描述 Microsoft Purview 中的元数据

Microsoft Purview 提供了多种对数据进行批注和组织的方法。 可以使用标记、术语、托管属性和业务资产。

但是,在何时使用哪个功能时,它可能并不总是显而易见的。 如果要显示数据集是由会计团队发布的,是否应标记它? 分配名为帐户团队的托管属性? 使用称为会计的术语呢? 或者,也许你应该与称为会计的部门资产建立关系?

没有一种正确的方法可以向数据添加上下文,但以下是有关标记、托管属性、业务术语和业务资产的一些最佳做法。

使用标记的最佳做法

如果想要快速标记数据资产,而无需一致性或控制,请使用标记。 标记是简单的关键字或短语,可应用于数据资产以提供快速、非正式的元数据。 它们可用于对数据资产进行分类,使其更易于发现和理解。 它们也是了解数据使用者如何描述数据的绝佳方式,因此你可以随着时间的推移将此语言合并到业务术语表中。

在以下示例中,我已使用第 4 季度收入标记了一些资产,以便我可以轻松地找到计划用于包含此信息的新报表的数据资产。 搜索关键字 (keyword) 将返回应用了该标记的所有数据:

显示 Microsoft Purview 搜索结果的屏幕截图,其中显示了使用Q4_Revenue标记的资产。

使用托管属性的最佳做法

使用托管属性扩展 Purview 中资产的可用字段。 托管属性是向数据目录添加结构化元数据的键值对。 Purview 扫描数据时,会添加有关数据的技术信息,例如数据类型、分类等。如果要添加更多字段,则需要定义托管属性。

在以下示例中,我添加了一个托管属性,使我可以使用发布表的部门标记表。 我使用托管属性,因为我想确保资产的标记方式始终与此信息完全相同。 我还希望在搜索数据时按发布者字段进行筛选。

显示资产详细信息页面的屏幕截图,其中包含发布者(供应链)的托管属性键值对。

此示例中的托管属性可帮助人们快速查找供应链团队发布的所有数据,但不会帮助某人了解发布者的定义,或者如果供应链是数据的发布者,则它意味着什么。 对于需要业务说明的任何信息,我们使用术语。

使用业务术语的最佳做法

使用业务术语为组织定义共享词汇表。 通过创建术语、标识其同义词、首字母缩略词、相关术语等,可以创建以分层方式组织的灵活受控分类。 术语术语表通过为整个组织内的概念、指标和其他重要元素提供一致的定义,帮助弥合公司各部门之间的沟通差距。

我将术语顺序分配给此表,因为它包含订单信息。

显示具有已分配订单期限的资产详细信息页的屏幕截图。

我使用术语,以便找到此数据的任何人都可以转到该术语来浏览订单的业务定义:

显示订单的术语详细信息页的屏幕截图。

使用业务资产的最佳做法

最后,可以通过创建其他资产类型来扩展 Purview 的元模型,以描述组织中的真实情况,例如部门、项目、产品和业务线。 查看数据资产时,了解数据如何适合你的业务通常很有帮助。 每当你想要将数据资产关联到特定组织结构、业务流程或其他任何可以令人信服地建模为实体的内容时,都可以使用业务资产。

在下面的示例中,我通过显示供应链部门 (业务资产) 管理订单履行业务流程 (使用 SalesOrderDetail 表的业务资产) 来描述 SalesOrderDetail 表的更多业务上下文。 以这种方式可视化业务上下文可以帮助其他人识别用于特定业务目的的“官方”数据集,并了解数据是否被合规使用。

显示供应链部门、订单履行业务流程和 SalesOrderDetail 表之间的关系的屏幕截图。

后续步骤

详细了解如何在 Microsoft Purview 中组织数据: 使用 Microsoft Purview 治理域:使用集合、术语表和业务上下文的最佳做法