你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
入门清单
在云规模分析的数据之旅中,你会发现采用生命周期中存在多个阶段。 本部分提供了一个快速入门清单,可帮助你分阶段采用方案。 这些阶段包括:
- 阶段 1:第一个登陆区域
- 阶段 2:额外的数据域
- 阶段 3:提升使用就绪性
- 阶段 4:关键治理组件
阶段 1 - 第一个登陆区域
- 定义第一个用例
- 部署第一个数据管理登陆区域
- 部署第一个数据登陆区域
- 定义第一个(引入)模式(例如批处理 parquet)
- 开发第一个数据产品(引入原始数据,提取到产品)
- 确定“足够”的治理
- 定义元数据要求(应用程序信息、架构元数据)
- 注册第一个数据使用者(手动过程)
阶段 2 - 额外的数据域
- 优化目标体系结构
- 部署更多数据登陆区域
- 扩展第二、第三和第四个数据产品
- 实现数据产品元数据存储库(数据库或 Excel)
- 实现第一组控制(数据质量、架构验证)
- 实现使用管道(将输入作为输出)
- 建立数据所有权
阶段 3 - 提升使用就绪性
- 实现自助服务注册和元数据引入
- 提供其他转换模式(转换框架、ETL 工具等)
- 扩充提供程序端的控制(术语表、世系、链接)
- 实现使用过程:审批、用例元数据、手动部署安全视图
- 建立数据管理控制板
阶段 4 - 关键治理组件
- 应用自动化(自动安全视图预配)
- 部署强大的数据治理,设置争议机制
- 完成数据产品指南
- 定义额外的互操作性标准
- 开发自助服务数据使用过程
- 开发数据查询、自助服务、目录、世系功能等。
- 开发更多数据市场功能。
摘要
通过这四个开发阶段,可以在第一阶段设置极简的可行产品,然后学习和迭代到第二阶段。 在整个分阶段的方法中,随着自助服务、可缩放治理平台的创建日益成熟而成长。