你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

入门清单

在云规模分析的数据之旅中,你会发现采用生命周期中存在多个阶段。 本部分提供了一个快速入门清单,可帮助你分阶段采用方案。 这些阶段包括:

  • 阶段 1:第一个登陆区域
  • 阶段 2:额外的数据域
  • 阶段 3:提升使用就绪性
  • 阶段 4:关键治理组件

阶段 1 - 第一个登陆区域

  • 定义第一个用例
  • 部署第一个数据管理登陆区域
  • 部署第一个数据登陆区域
  • 定义第一个(引入)模式(例如批处理 parquet)
  • 开发第一个数据产品(引入原始数据,提取到产品)
  • 确定“足够”的治理
  • 定义元数据要求(应用程序信息、架构元数据)
  • 注册第一个数据使用者(手动过程)

阶段 2 - 额外的数据域

  • 优化目标体系结构
  • 部署更多数据登陆区域
  • 扩展第二、第三和第四个数据产品
  • 实现数据产品元数据存储库(数据库或 Excel)
  • 实现第一组控制(数据质量、架构验证)
  • 实现使用管道(将输入作为输出)
  • 建立数据所有权

阶段 3 - 提升使用就绪性

  • 实现自助服务注册和元数据引入
  • 提供其他转换模式(转换框架、ETL 工具等)
  • 扩充提供程序端的控制(术语表、世系、链接)
  • 实现使用过程:审批、用例元数据、手动部署安全视图
  • 建立数据管理控制板

阶段 4 - 关键治理组件

  • 应用自动化(自动安全视图预配)
  • 部署强大的数据治理,设置争议机制
  • 完成数据产品指南
  • 定义额外的互操作性标准
  • 开发自助服务数据使用过程
  • 开发数据查询、自助服务、目录、世系功能等。
  • 开发更多数据市场功能。

摘要

通过这四个开发阶段,可以在第一阶段设置极简的可行产品,然后学习和迭代到第二阶段。 在整个分阶段的方法中,随着自助服务、可缩放治理平台的创建日益成熟而成长。

后续步骤