Desenvolvimento do Agile de projetos de ciência de dados
Este documento descreve como os desenvolvedores podem executar um projeto de ciência de dados de modo sistemático, com controle de versão e colaborativo em uma equipe de projeto usando o TDSP (Processo de Ciência de Dados da Equipe). O TDSP é uma estrutura desenvolvida pela Microsoft que fornece uma sequência estruturada de atividades para executar soluções de análise de previsão baseadas em nuvem de forma eficaz. Para obter uma descrição das funções e tarefas que são tratadas por uma equipe de ciência de dados com padronização no TDSP, consulte Tarefas e funções do Processo de Ciência de Dados da Equipe.
Este artigo inclui instruções sobre como:
- Fazer planejamento de sprint para itens de trabalho envolvidos em um projeto.
- Adicionar itens de trabalho em sprints.
- Crie e use um modelo de item de trabalho derivado do Agile que se alinhe especificamente com os estágios do ciclo de vida TDSP.
As instruções seguintes descrevem as etapas necessárias para configurar um ambiente de equipe TDSP usando o AzureBoards e Azure Repos no Azure DevOps. As instruções usam o Azure DevOps porque é como implementar o TDSP na Microsoft. Se o seu grupo usa uma plataforma de Hospedagem de código diferente, as tarefas do líder de equipe geralmente não são alteradas, mas a maneira de concluir as tarefas é diferente. Por exemplo, vincular um item de trabalho com uma ramificação git pode não ser o mesmo com o GitHub como é com Azure Repos.
A figura a seguir ilustra um planejamento de sprint típico, codificação e fluxo de trabalho de controle do código-fonte para um projeto de ciência de dados:
Tipos de item de trabalho
Na estrutura de planejamento de sprint do TDSP, há quatro tipos usados com frequência de itens de trabalho: Recurso, História de usuário, Tarefa e Bug. A pendência de todos os itens de trabalho está no nível do projeto, não no nível do repositório git.
Aqui estão as definições para os tipos de item de trabalho:
Recurso: um Recurso corresponde a uma interação de projeto. Compromissos diferentes com um cliente são recursos diferentes, e é melhor considerar diferentes fases de um projeto como recursos diferentes. Se escolher um esquema como <ClientName>-<EngagementName> para nomear os recursos, então você poderá reconhecer facilmente o contexto do projeto e da interação nos próprios nomes.
História de Usuário: Histórias de Usuário são item de trabalho necessários para completar uma Funcionalidade de ponta-a-ponta. Exemplos de Histórias de Usuários incluem:
- Obter dados
- Explorar dados
- Gerar recursos.
- Compilar modelos
- Operacionalizar modelos
- Treinar modelos novamente
Tarefa: itens de trabalho atribuído que precisam ser realizadas para concluir uma História de Usuário específica. Por exemplo, as Tarefas na História de Usuário Obtenção de dados podem ser:
- Obter Credenciais do SQL Server
- Carregar dados para o Azure Synapse Analytics
Bug: bugs são problemas no código ou documentos existentes que devem ser corrigidos para concluir uma tarefa. Se os bugs forem causados por itens de trabalho ausentes, eles poderão ser escalados para serem histórias de usuários ou tarefas.
Os cientistas de dados podem se sentir mais confortáveis usando um modelo ágil que substitui recursos, histórias de usuários e tarefas com estágios e subestágios do ciclo de vida de TDSP. Para criar um modelo derivado de Agile que se alinhe especificamente com os estágios do ciclo de vida TDSP, consulte usar um modelo de trabalho do Agile TDSP.
Observação
O TDSP empresta os conceitos de recursos, histórias de usuários, tarefas e bugs do SCM (gerenciamento de código de software). Os conceitos TDSP podem diferir ligeiramente das suas definições de SCM convencionais.
Planejar sprints
Muitos cientistas de dados estão envolvidos com vários projetos que pode levar meses para ser concluído e proceder em pontos diferentes. O planejamento de sprint é útil para priorização de projeto e planejamento e alocação de recursos. No Azure Boards, você pode facilmente criar, gerenciar e acompanhar itens de trabalho para seu projeto e realizar planejamento de sprint para garantir projetos estão avançando conforme o esperado.
Para obter mais informações sobre o planejamento do Sprint, consulte sprints do Scrum.
Para obter mais informações sobre o planejamento do Sprint em Azure Boards, consulte atribuir itens da pendências a um Sprint.
Adicionar um recurso à pendência
Depois que o projeto e o repositório de código do projeto forem criados, você poderá adicionar um recurso à lista de pendências para representar o trabalho do seu projeto.
Na página de projeto, selecione Boards>Backlogs na navegação esquerda.
Na guia lista de pendências, se o tipo de item de trabalho na barra superior for histórias, menu suspenso e selecione recursos. Em seguida, selecione novo item de trabalho.
Insira um título para o recurso, geralmente o nome do projeto e, em seguida, selecione Adicionar à parte superior.
Na lista de pendências, selecione e abra o novo recurso. Preencha a descrição, atribua um membro da equipe e defina parâmetros de planejamento.
Você também pode vincular o recurso ao repositório de código do Azure Repos do projeto selecionando Adicionar link na seção de desenvolvimento.
Depois de editar o recurso, selecione Salvar e fechar.
Adicionar uma história de usuário ao recurso
Sob o recurso, você pode adicionar histórias de usuário para descrever as principais etapas necessárias para concluir o projeto.
Para adicionar uma nova história de usuário a um recurso:
Na guia Lista de pendências, selecione + à esquerda do recurso.
Dê um título à história do usuário e edite detalhes como atribuição, status, descrição, comentários, planejamento e prioridade.
Você também pode vincular a Históra de Usuário ao branch do repositório de código do Azure Repos do projeto selecionando Adicionar link na seção de desenvolvimento. Selecione o repositório e a ramificação para os quais você deseja vincular o item de trabalho e, em seguida, selecione OK.
Quando terminar de editar a história do usuário, selecione Salvar e Fechar.
Adicionar uma tarefa a uma história de usuário
As tarefas são etapas detalhadas específicas que são necessárias para concluir cada história de usuário. Depois de concluir todas as tarefas de uma história do usuário, a história do usuário deve ser concluída também.
Para adicionar uma tarefa a uma história de usuário, selecione o + próximo ao item de história de usuário e selecione tarefa. Preencha o título e outras informações na tarefa.
Depois de criar recursos, histórias de usuários e tarefas, você pode exibi-los nos modos de exibição de pendências ou de placas para controlar seu status.
Usar um modelo de trabalho do Agile TDSP
Os cientistas de dados podem se sentir mais confortáveis usando um modelo ágil que substitui recursos, histórias de usuários e tarefas com estágios e subestágios do ciclo de vida de TDSP. No Azure Boards, você pode criar um modelo derivado de Agile que usa estágios de ciclo de vida TDSP para criar e acompanhar itens de trabalho. Os passos à seguir são um passo-a-passo para configurar o modelo de processo agile de ciência de dados específico e criar item de trabalho de ciência de dados com base no modelo.
Configure um modelo de processo de ciência de dados Agile
Na página principal da organização DevOps do Azure, selecione configurações da organização no painel de navegação esquerdo.
Nas configurações da organização navegação à esquerda, em placas, selecione processar.
No painel todos os processos, selecione ... ao lado de Agilee, em seguida, selecione criar processo herdado.
Na caixa de diálogo criar processo herdado do Agile, digite o nome AgileDataScienceProcesse selecione criar processo.
Em todos os processos, selecione o novo AgileDataScienceProcess.
Na guia tipos de item de trabalho, desabilite Epic, recurso, história de usuárioe tarefa selecionando o ... ao lado de cada item e, em seguida, selecionando desabilitar.
Em todos os processos, selecione a guia níveis de pendências. Em rependências de portfólios, selecione ... ao lado de Epic (desabilitado)e, em seguida, selecione Editar/renomear.
Na caixa de diálogo Editar nível de registro posterior:
- Em nome, substitua Epic por projetos TDSP.
- Em tipos de item de trabalho neste nível de registro posterior, selecione novo tipo de item de trabalho, insira projeto TDSPe selecione Adicionar.
- Em tipo de item de trabalho padrão, menu suspenso e selecione projeto TDSP.
- Selecione Salvar.
Siga as mesmas etapas para renomear recursos para estágios TDSPe adicione os seguintes novos tipos de item de trabalho:
- Noções básicas sobre negócios
- Aquisição de dados
- Modelagem
- Implantação
Em pendências de requisito, renomeie as histórias para subestágios TDSP, adicione o novo subestágio TDSPdo tipo de item de trabalho e defina o tipo de item de trabalho padrão como subestágio TDSP.
Em pendências de iteração, adicione um novo tipo de item de trabalho TDSP tarefae defina-o como o tipo de item de trabalho padrão.
Depois de completar destas etapas, os Níveis de registro posterior devem ser assim:
Criar itens de trabalho do processo de ciência de dados Agile
Você pode usar o modelo de processo de ciência de dados para criar projetos do TDSP e acompanhar itens de trabalho que correspondem a estágios do ciclo de vida do TDSP.
Na página principal da organização DevOps do Azure, selecione novo projeto.
Na caixa de diálogo criar novo projeto, dê um nome ao projeto e selecione avançado.
Em processo de item de trabalho, menu suspenso e selecione AgileDataScienceProcesse, em seguida, selecione criar.
No projeto recém-criado, selecione quadros> dependências na navegação à esquerda.
Para tornar os projetos do TDSP visíveis, selecione o ícone definir configurações da equipe. Na tela configurações, marque a caixa de seleção projetos TDSP e, em seguida, selecione salvar e fechar.
Para criar um projeto TDSP específico de ciência de dados, selecione projetos do TDSP na barra superior e, em seguida, selecione novo item de trabalho.
No pop-up, dê um nome ao item de trabalho do projeto TDSP e selecione Adicionar à parte superior.
Para adicionar um item de trabalho no projeto TDSP, selecione o + próximo ao projeto e, em seguida, selecione o tipo de item de trabalho a ser criado.
Preencha os detalhes no novo item de trabalho e selecione Salvar e fechar&.
Continue a selecionar os + símbolos ao lado de itens de trabalho para adicionar novos estágios, subestágios e tarefas do TDSP.
Veja um exemplo de como os itens de trabalho de projeto de ciência de dados devem ser exibidos na visualização do Backlogs:
Colaboradores
Esse artigo é mantido pela Microsoft. Ele foi originalmente escrito pelos colaboradores a seguir.
Autor principal:
- Mark Tabladillo | Arquiteto de soluções de nuvem sênior
Para ver perfis não públicos do LinkedIn, entre no LinkedIn.
Próximas etapas
- Codificação colaborativa com Git descreve como fazer o desenvolvimento de colaboração de código para projetos de ciência de dados usando o Git como a estrutura de desenvolvimento de código compartilhado e como vincular essas atividades de codificação ao trabalho planejado com o processo do agile.
Recursos adicionais sobre processos Agile: