你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Team Data Science Process 生命周期
Team Data Science Process (TDSP) 提供团队可用于构建数据科学项目的生命周期。 生命周期概述了成功完成项目所要执行的步骤。
如果你有一个属于智能应用程序的数据科学项目,则应使用此生命周期。 智能应用程序部署机器学习或 AI 模型以进行预测分析。 还可以使用此过程来探索数据科学项目和即席分析项目,但可能不需要实现生命周期的每一步。
你的团队可以将基于任务的 TDSP 与其他数据科学生命周期相结合,如数据挖掘的跨行业标准过程 (CRISP-DM)、数据库中的知识发现 (KDD) 流程或贵组织自己的定制过程。
目的和信誉
TDSP 的目的是简化和标准化数据科学和 AI 项目的方法。 Microsoft 在数百个项目中应用了这种结构化方法。 研究人员研究了 TDSP,并在经过同行评审的文献中发表了他们的发现。 TDSP 的体系结构框架在许多领域进行了全面测试和验证。
五个生命周期阶段
TDSP 生命周期由团队以迭代方式执行的 5 个主要阶段组成。 这些阶段包括:
此处直观地展示了 TDSP 生命周期:
TDSP 生命周期是一系列步骤,提供有关创建预测模型的指导。 团队在计划使用的生产环境中部署预测模型以构建智能应用程序。 此过程生命周期的目标是将数据科学项目引导到明确的参与终点。 数据科学是研究和发现中的一项运用。 使用定义完善的过程将任务传达给团队时,可以增加成功执行数据科学项目的机会。
每个阶段都有其自己的文章,其中概述了:
- 目标:阶段的目标。
- 操作方法:你在阶段中执行的任务的大纲以及有关如何完成这些任务的指南。
- 项目:在阶段中生成所需的可交付结果和资源,可用于协助创建它们。
同行评审的引文
研究人员发表了关于 TDSP 的经过同行评审的文献。 查看以下材料以调查 TDSP 功能和应用程序。
作者
本文由 Microsoft 维护, 它最初是由以下贡献者撰写的。
首席作者:
- Mark Tabladillo | 高级云解决方案架构师
要查看非公开的 LinkedIn 个人资料,请登录到 LinkedIn。
相关资源
- 有关生命周期的第一个阶段,请参阅业务理解。
- 什么是团队数据科学过程?
- 比较机器学习产品和技术