El ciclo de vida del proceso de ciencia de datos en equipo

El Proceso de ciencia de datos en equipo (TDSP) ofrece un ciclo de vida que el equipo puede usar para estructurar los proyectos de ciencia de datos. El ciclo de vida describe los pasos que puede seguir para completar correctamente un proyecto.

Debe usar este ciclo de vida si tiene un proyecto de ciencia de datos que forma parte de una aplicación inteligente. Las aplicaciones inteligentes implementan modelos de Machine Learning o IA para realizar un análisis predictivo. También puede usar este proceso para proyectos de ciencia de datos exploratorios y proyectos de análisis improvisados, pero es posible que no necesite implementar todos los pasos del ciclo de vida.

Su equipo puede combinar el TDSP basado en tareas con otros ciclos de vida de la ciencia de datos, como el proceso estándar intersectorial para la minería de datos (CRISP-DM), el proceso de descubrimiento de conocimientos en bases de datos (KDD) u otro proceso personalizado propio de su organización.

Propósito y credibilidad

El propósito de TDSP es simplificar y estandarizar el enfoque de los proyectos de ciencia de datos e IA. Microsoft ha aplicado esta metodología estructurada en cientos de proyectos. Los investigadores estudiaron el TDSP y publicaron sus hallazgos en la documentación revisada por expertos. El marco arquitectónico del TDSP se ha probado a fondo y ha demostrado su eficacia en muchos ámbitos.

Cinco fases del ciclo de vida

El ciclo de vida de TDSP se compone de cinco fases principales que el equipo ejecuta de forma iterativa. Estas fases incluyen:

Esta es una representación visual del ciclo de vida de TDSP:

Diagram that shows the stages of the TDSP lifecycle.

El ciclo de vida del TDSP es una secuencia de pasos que proporcionan instrucciones para crear modelos predictivos. El equipo implementa modelos de predicción en un entorno de producción que tiene previsto utilizar para crear aplicaciones inteligentes. El objetivo del ciclo de vida de este proceso consiste en hacer avanzar un proyecto de ciencia de datos hacia un punto final de interacción claro. La ciencia de datos es un ejercicio de investigación y detección. Cuando se usa un proceso bien definido para comunicar tareas al equipo, aumenta la posibilidad de llevar a cabo correctamente un proyecto de ciencia de datos.

Cada fase tiene su propio artículo que describe:

  • Objetivos: los objetivos de la fase.
  • Cómo hacerlo: un resumen de las tareas que realiza en la etapa y orientación sobre cómo completarlas.
  • Artefactos: los resultados que necesita generar durante la fase y los recursos que puede usar para ayudarle a crearlos.

Citas revisadas por expertos

Los investigadores publican documentación revisada por expertos sobre el TDSP. Revise el siguiente material para investigar las aplicaciones y características de TDSP.

Colaboradores

Microsoft mantiene este artículo. Originalmente lo escribieron los siguientes colaboradores.

Autor principal:

Para ver los perfiles no públicos de LinkedIn, inicie sesión en LinkedIn.