Cycle de vie du processus TDSP
Le processus TDSP fournit un cycle de vie recommandé que votre équipe peut utiliser pour structurer vos projets de science des données. Le cycle de vie décrit les étapes à suivre pour mener correctement un projet à bien.
Vous devez utiliser ce cycle de vie si vous avez un projet de science des données qui fait partie d’une application intelligente. Les applications intelligentes déploient des modèles de Machine Learning ou d’intelligence artificielle pour l’analytique prédictive. Vous pouvez également utiliser ce processus pour des projets de science des données exploratoires et des projets d’analytique improvisée, mais vous n’avez peut-être pas besoin d’implémenter chaque étape du cycle de vie.
Votre équipe peut combiner le processus TDSP basé sur des tâches avec d’autres cycles de vie des sciences des données, tels que le processus CRISP-DM (Cross Industry Standard Process for Data Mining), la découverte KDD (Knowledge Discovery in Databases) ou le processus personnalisé de votre organisation.
Objectif et crédibilité
L’objectif TDSP est de simplifier et de normaliser votre approche des projets de science des données et d’IA. Microsoft a appliqué cette méthodologie structurée à des centaines de projets. Les chercheurs ont étudié l’approche TDSP et publié leurs résultats dans de la documentation examinée par les pairs. Le cadre architectural du TDSP est soigneusement testé et son efficacité a été démontrée dans de nombreux domaines.
Cinq étapes de cycle de vie
Le cycle de vie du processus TDSP se compose de cinq phases majeures que votre équipe exécute de manière itérative. Ces étapes sont les suivantes :
- Présentation de l’entreprise
- Acquisition et compréhension des données
- Modélisation
- Déploiement
- Acceptation du client
Voici une représentation visuelle du cycle de vie TDSP :
Le cycle de vie TDSP est une séquence d’étapes qui fournissent des conseils pour la création de modèles prédictifs. Votre équipe déploie les modèles prédictifs dans un environnement de production que vous envisagez d’utiliser pour générer des applications intelligentes. Ce cycle de vie a pour objectif d’orienter un projet de science des données vers un point final d’engagement clair. La science des données est un exercice de recherche et de découverte. Lorsque vous utilisez un processus bien défini pour communiquer des tâches à votre équipe, vous augmentez les chances de mener à bien un projet de science des données.
Chaque étape a son propre article qui décrit :
- Objectifs : Objectifs de la phase.
- Comment procéder : un aperçu des tâches que vous effectuez dans l’étape et des conseils sur la façon de les accomplir.
- Artefacts : livrables que vous devez produire pendant l’étape et les ressources que vous pouvez utiliser pour vous aider à les créer.
Citations examinées par les pairs
Les chercheurs publient des documents examinés par des pairs sur le TDSP. Passez en revue les documents suivants pour examiner les fonctionnalités et les applications TDSP.
Software Engineering for Machine Learning: A Case Study (pages 291-300)
An Artificial Intelligence Life Cycle: From Conception to Production
Management of Machine Learning Lifecycle Artifacts: A Survey (pages 18–35)
Construction of a Quality Model for Machine Learning Systems (pages 307–335)
Contributeurs
Cet article est géré par Microsoft. Il a été écrit à l’origine par les contributeurs suivants.
Auteur principal :
- Mark Tabladillo | Architecte de solution cloud senior
Pour afficher les profils LinkedIn non publics, connectez-vous à LinkedIn.
Ressources associées
- Pour la première étape du cycle de vie, consultez Business Understanding.
- Qu’est-ce que le processus Team Data Science Process ?
- Comparer les produits et les technologies d’apprentissage automatique