你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Team Data Science Process 生命周期

Team Data Science Process (TDSP) 提供团队可用于构建数据科学项目的生命周期。 生命周期概述了成功完成项目所要执行的步骤。

如果你有一个属于智能应用程序的数据科学项目,则应使用此生命周期。 智能应用程序部署机器学习或 AI 模型以进行预测分析。 还可以使用此过程来探索数据科学项目和即席分析项目,但可能不需要实现生命周期的每一步。

你的团队可以将基于任务的 TDSP 与其他数据科学生命周期相结合,如数据挖掘的跨行业标准过程 (CRISP-DM)、数据库中的知识发现 (KDD) 流程或贵组织自己的定制过程。

目的和信誉

TDSP 的目的是简化和标准化数据科学和 AI 项目的方法。 Microsoft 在数百个项目中应用了这种结构化方法。 研究人员研究了 TDSP,并在经过同行评审的文献中发表了他们的发现。 TDSP 的体系结构框架在许多领域进行了全面测试和验证。

五个生命周期阶段

TDSP 生命周期由团队以迭代方式执行的 5 个主要阶段组成。 这些阶段包括:

此处直观地展示了 TDSP 生命周期:

Diagram that shows the stages of the TDSP lifecycle.

TDSP 生命周期是一系列步骤,提供有关创建预测模型的指导。 团队在计划使用的生产环境中部署预测模型以构建智能应用程序。 此过程生命周期的目标是将数据科学项目引导到明确的参与终点。 数据科学是研究和发现中的一项运用。 使用定义完善的过程将任务传达给团队时,可以增加成功执行数据科学项目的机会。

每个阶段都有其自己的文章,其中概述了:

  • 目标:阶段的目标。
  • 操作方法:你在阶段中执行的任务的大纲以及有关如何完成这些任务的指南。
  • 项目:在阶段中生成所需的可交付结果和资源,可用于协助创建它们。

同行评审的引文

研究人员发表了关于 TDSP 的经过同行评审的文献。 查看以下材料以调查 TDSP 功能和应用程序。

作者

本文由 Microsoft 维护, 它最初是由以下贡献者撰写的。

首席作者:

若要查看非公开的 LinkedIn 个人资料,请登录到 LinkedIn。