第 3 部分:发布数据产品

创建数据产品对于确保组织能够发现正确的数据至关重要。 数据产品有助于防止过度管理数据资产中低值或无价值的数据,因为它没有用途或价值有限。 确保数据专家即将发布数据产品将激活最有价值的数据,并根据该价值构建适当的治理级别。 策展技术团队不知道其业务目的的资产,或试图管理复杂且不断增长的数据资产中的所有内容,将导致额外的时间和生产力下降,从而追查可能永远不会使用或可能只是从资产中删除的数据的详细信息。 相反,专注于具有价值且人们需要发现和构建更多价值的数据片段。 随着团队使用更多数据并更好地了解需要什么或更有用的数据,可以创建满足这些需求的数据产品,并且治理可以进行调整,以确保它始终根据数据的价值和敏感度保持正确的大小。

先决条件

创建和发布数据产品

  1. 打开 Microsoft Purview 门户

  2. 选择数据目录

  3. 依次选择“ 目录管理 ”和“ 治理域”。

  4. “治理域 ”页中,选择“个人运行状况”域

  5. 选择“业务概念”下的“转到数据产品”链接

  6. 在这里,称为数据产品所有者的数据专家将识别组织中其他人打算使用的数据资产,并提供必要的信息来使其可用。

  7. 选择“+ 新建数据产品

  8. 提供有关数据产品的详细信息

    1. 名称:“Covid-19 疫苗接种和病例趋势(按年龄)
    2. 描述:“这些数据来自疾病预防控制中心,作为美国卫生部 & 人类服务部的一部分。 这些数据包含美国国家一级按年龄组分列的疫苗接种和病例趋势。 数据按至少一剂进行分层,并完全接种疫苗。 数据还代表所有疫苗合作伙伴,包括司法管辖区合作伙伴诊所、零售药店、长期护理设施、透析中心、联邦紧急管理局和卫生资源与服务管理局合作伙伴站点,以及联邦实体设施。
    3. 类型:数据集
    4. 选择“下一步”。
    5. 用例:“此数据供公众使用,旨在帮助了解不同年龄组的疫苗接种趋势和新病例。 年龄分为两组,年龄从 <2岁到65岁以上。 同样,每日数字也提供了趋势,这些数字按年龄组提供7天新病例的平均值。
    6. 标记为 “已选中”,标记为“已认可 ”。
    7. 选择“保存”
  9. 现在,你已生成了数据产品的基本元数据。接下来,添加一些属性并映射数据映射中的资产。

    选择要添加到数据产品的资产的屏幕截图。

  10. 选择“ + 添加数据资产 ”按钮。

  11. 你将看到已扫描到数据映射中的资产,其中包括数据源的所有文件夹和层。

  12. 搜索添加到数据湖黄金容器的 Covid19 疫苗和病例趋势 资产,然后选择此资源集。

  13. 选择“添加”。 可以根据需要为数据产品选择任意数量的资产,但此处只需要一个。

    提示

    尝试“ 获取建议 ”按钮,让 GenAI 帮助从数据映射中的资产中进行选择,并从减少的结果列表中选择“Covid19 疫苗和病例趋势”。

  14. 现在可以看到添加到数据产品的资产。

  15. 选择术语表术语标题旁边的“+ 添加术语”

    向数据产品添加术语表术语的屏幕截图。

  16. 选择之前创建的“爆发”术语,然后选择“添加

    选择术语表术语的屏幕截图。

  17. 现在,应会看到映射到数据产品的资产中年龄组的关键数据元素。

  18. 选择 OKR 标题旁边的“+ 添加 OKR”

  19. 选择“通过启用有效的患者疫苗使用来降低大流行风险”。 它是我们在 第一部分中创建的目标。

管理数据产品访问请求策略

在页面顶部,发布数据产品之前的最后一步是选择“ 管理策略 ”按钮。 此处,访问策略和请求访问工作流是通过做出选择并提供要审批的名称来配置的。 还可以使用“ 继承的策略 ”选项卡查看适用于我们之前应用的数据副本证明的治理域策略。 对于来自疫情术语表术语的 经理批准 ,情况相同。

  1. 选择“ 管理策略 ”选项卡。

    管理数据产品策略的屏幕截图。

  2. “访问时间限制”下,提供访问请求在需要续订之前多长时间的详细信息。 我们将此设置设置为授予长达一年的访问权限。

  3. 在框中,放入 1。

  4. 在下拉列表中选择年份。

  5. 在“审批要求”下,在“审批者”框中提供你的姓名。 (将需要在 Microsoft Entra ID) 中注册的名称

    注意

    我们不需要检查经理批准,因为我们从疫情术语表术语继承了该策略。

  6. 选择 “预览请求表单 ”按钮,查看请求访问时目录使用者将查看的内容。 你将看到需要数据副本证明和经理批准,因为它们是由治理域和术语表术语设置的。

    访问请求表单预览的屏幕截图。

  7. 选择“保存更改”。

映射数据资产并配置访问策略后,即可将数据产品发布到目录。

  1. 在数据产品上选择“ 发布 ”。

  2. 尝试在之前创建的其他域中创建利润报表

    1. 利润报表,类型:仪表板/报表。
    2. 产品母版,类型:Maser 数据和参考数据。

注意

可以向这些资产添加许多资产,并查看具有许多资产的数据产品的外观,以及数据产品可能来自任何域的术语,以查看如何使用术语表使用一组一致的术语来描述数据。

后续步骤

第 4 部分 - 运行数据质量