O ciclo de vida do Processo de Ciência de Dados da Equipe
O Processo de Ciência de Dados da Equipe (TDSP) fornece um ciclo de vida que sua equipe pode usar para estruturar seus projetos de ciência de dados. O ciclo de vida descreve as etapas que você pode executar para concluir um projeto com êxito.
Você deve usar esse ciclo de vida se tiver um projeto de ciência de dados que faça parte de um aplicativo inteligente. Aplicativos inteligentes implantam modelos de aprendizado de máquina ou IA para análise preditiva. Você também pode usar esse processo para projetos exploratórios de ciência de dados e projetos de análise improvisados, mas talvez não seja necessário implementar todas as etapas do ciclo de vida.
Sua equipe pode combinar o TDSP baseado em tarefas com outros ciclos de vida de ciência de dados, como o processo padrão intersetorial para mineração de dados (CRISP-DM), o processo de descoberta de conhecimento em bancos de dados (KDD) ou o próprio processo personalizado da sua organização.
Finalidade e credibilidade
O objetivo do TDSP é simplificar e padronizar sua abordagem para projetos de ciência de dados e IA. A Microsoft aplicou esta metodologia estruturada em centenas de projetos. Os pesquisadores estudaram o TDSP e publicaram suas descobertas na literatura revisada por pares. A estrutura arquitetônica do TDSP é exaustivamente testada e comprovadamente eficaz em muitas áreas.
Cinco estágios do ciclo de vida
O ciclo de vida do TDSP é composto por cinco estágios principais que sua equipe executa iterativamente. Estas etapas incluem:
- Compreensão do negócio
- Aquisição e compreensão de dados
- Modelação
- Implementação
- Aceitação do cliente
Aqui está uma representação visual do ciclo de vida do TDSP:
O ciclo de vida do TDSP é uma sequência de etapas que fornecem orientação para a criação de modelos preditivos. Sua equipe implanta os modelos preditivos em um ambiente de produção que você planeja usar para criar aplicativos inteligentes. O objetivo desse ciclo de vida do processo é navegar em um projeto de ciência de dados em direção a um ponto de extremidade de engajamento claro. A ciência de dados é um exercício de pesquisa e descoberta. Quando você usa um processo bem definido para comunicar tarefas à sua equipe, você aumenta a chance de realizar com sucesso um projeto de ciência de dados.
Cada etapa tem o seu próprio artigo que descreve:
- Metas: Os objetivos da etapa.
- Como fazer: Um esboço das tarefas que você executa no estágio e orientação sobre como concluí-las.
- Artefatos: os resultados finais que você precisa produzir durante o estágio e os recursos que você pode usar para ajudá-lo a criá-los.
Citações revistas por pares
Os pesquisadores publicam literatura revisada por pares sobre o TDSP. Analise o material a seguir para investigar os recursos e aplicativos do TDSP.
Engenharia de Software para Machine Learning: Um Estudo de Caso (páginas 291-300)
Um ciclo de vida de inteligência artificial: da conceção à produção
Ciência de Dados: Um Tratamento Sistemático (páginas 106–116)
Gerenciamento de artefatos do ciclo de vida do aprendizado de máquina: uma pesquisa (páginas 18–35)
Construção de um Modelo de Qualidade para Sistemas de Aprendizagem Automática (páginas 307–335)
Contribuidores
Este artigo é mantido pela Microsoft. Foi originalmente escrito pelos seguintes contribuidores.
Autor principal:
- Mark Tabladillo - Brasil | Arquiteto de Soluções Cloud Sênior
Para ver perfis não públicos do LinkedIn, inicie sessão no LinkedIn.
Recursos relacionados
- Para o primeiro estágio do ciclo de vida, consulte Compreensão de negócios.
- O que é o Processo de Ciência de Dados da Equipe?
- Compare produtos e tecnologias de aprendizado de máquina