Desenvolvimento do Agile de projetos de ciência de dados

Este documento descreve como os desenvolvedores podem executar um projeto de ciência de dados de modo sistemático, com controle de versão e colaborativo em uma equipe de projeto usando o TDSP (Processo de Ciência de Dados da Equipe). O TDSP é uma estrutura desenvolvida pela Microsoft que fornece uma sequência estruturada de atividades para executar soluções de análise de previsão baseadas em nuvem de forma eficaz. Para obter uma descrição das funções e tarefas que são tratadas por uma equipe de ciência de dados com padronização no TDSP, consulte Tarefas e funções do Processo de Ciência de Dados da Equipe.

Este artigo inclui instruções sobre como:

  • Fazer planejamento de sprint para itens de trabalho envolvidos em um projeto.
  • Adicionar itens de trabalho em sprints.
  • Crie e use um modelo de item de trabalho derivado do Agile que se alinhe especificamente com os estágios do ciclo de vida TDSP.

As instruções seguintes descrevem as etapas necessárias para configurar um ambiente de equipe TDSP usando o AzureBoards e Azure Repos no Azure DevOps. As instruções usam o Azure DevOps porque é como implementar o TDSP na Microsoft. Se o seu grupo usa uma plataforma de Hospedagem de código diferente, as tarefas do líder de equipe geralmente não são alteradas, mas a maneira de concluir as tarefas é diferente. Por exemplo, vincular um item de trabalho com uma ramificação git pode não ser o mesmo com o GitHub como é com Azure Repos.

A figura a seguir ilustra um planejamento de sprint típico, codificação e fluxo de trabalho de controle do código-fonte para um projeto de ciência de dados:

Team Data Science Process

Tipos de item de trabalho

Na estrutura de planejamento de sprint do TDSP, há quatro tipos usados com frequência de itens de trabalho: Recurso, História de usuário, Tarefa e Bug. A pendência de todos os itens de trabalho está no nível do projeto, não no nível do repositório git.

Aqui estão as definições para os tipos de item de trabalho:

  • Recurso: um Recurso corresponde a uma interação de projeto. Compromissos diferentes com um cliente são recursos diferentes, e é melhor considerar diferentes fases de um projeto como recursos diferentes. Se escolher um esquema como <ClientName>-<EngagementName> para nomear os recursos, então você poderá reconhecer facilmente o contexto do projeto e da interação nos próprios nomes.

  • História de Usuário: Histórias de Usuário são item de trabalho necessários para completar uma Funcionalidade de ponta-a-ponta. Exemplos de Histórias de Usuários incluem:

    • Obter dados
    • Explorar dados
    • Gerar recursos.
    • Compilar modelos
    • Operacionalizar modelos
    • Treinar modelos novamente
  • Tarefa: itens de trabalho atribuído que precisam ser realizadas para concluir uma História de Usuário específica. Por exemplo, as Tarefas na História de Usuário Obtenção de dados podem ser:

    • Obter Credenciais do SQL Server
    • Carregar dados para o Azure Synapse Analytics
  • Bug: bugs são problemas no código ou documentos existentes que devem ser corrigidos para concluir uma tarefa. Se os bugs forem causados por itens de trabalho ausentes, eles poderão ser escalados para serem histórias de usuários ou tarefas.

Os cientistas de dados podem se sentir mais confortáveis usando um modelo ágil que substitui recursos, histórias de usuários e tarefas com estágios e subestágios do ciclo de vida de TDSP. Para criar um modelo derivado de Agile que se alinhe especificamente com os estágios do ciclo de vida TDSP, consulte usar um modelo de trabalho do Agile TDSP.

Observação

O TDSP empresta os conceitos de recursos, histórias de usuários, tarefas e bugs do SCM (gerenciamento de código de software). Os conceitos TDSP podem diferir ligeiramente das suas definições de SCM convencionais.

Planejar sprints

Muitos cientistas de dados estão envolvidos com vários projetos que pode levar meses para ser concluído e proceder em pontos diferentes. O planejamento de sprint é útil para priorização de projeto e planejamento e alocação de recursos. No Azure Boards, você pode facilmente criar, gerenciar e acompanhar itens de trabalho para seu projeto e realizar planejamento de sprint para garantir projetos estão avançando conforme o esperado.

Para obter mais informações sobre o planejamento do Sprint, consulte sprints do Scrum.

Para obter mais informações sobre o planejamento do Sprint em Azure Boards, consulte atribuir itens da pendências a um Sprint.

Adicionar um recurso à pendência

Depois que o projeto e o repositório de código do projeto forem criados, você poderá adicionar um recurso à lista de pendências para representar o trabalho do seu projeto.

  1. Na página de projeto, selecione Boards>Backlogs na navegação esquerda.

  2. Na guia lista de pendências, se o tipo de item de trabalho na barra superior for histórias, menu suspenso e selecione recursos. Em seguida, selecione novo item de trabalho.

    Select New Work Item

  3. Insira um título para o recurso, geralmente o nome do projeto e, em seguida, selecione Adicionar à parte superior.

    Enter a title and select Add to top

  4. Na lista de pendências, selecione e abra o novo recurso. Preencha a descrição, atribua um membro da equipe e defina parâmetros de planejamento.

    Você também pode vincular o recurso ao repositório de código do Azure Repos do projeto selecionando Adicionar link na seção de desenvolvimento.

    Depois de editar o recurso, selecione Salvar e fechar.

    Edit Feature and select Save & Close

Adicionar uma história de usuário ao recurso

Sob o recurso, você pode adicionar histórias de usuário para descrever as principais etapas necessárias para concluir o projeto.

Para adicionar uma nova história de usuário a um recurso:

  1. Na guia Lista de pendências, selecione + à esquerda do recurso.

    Add a new User Story under the Feature

  2. Dê um título à história do usuário e edite detalhes como atribuição, status, descrição, comentários, planejamento e prioridade.

    Você também pode vincular a Históra de Usuário ao branch do repositório de código do Azure Repos do projeto selecionando Adicionar link na seção de desenvolvimento. Selecione o repositório e a ramificação para os quais você deseja vincular o item de trabalho e, em seguida, selecione OK.

    Add link

  3. Quando terminar de editar a história do usuário, selecione Salvar e Fechar.

Adicionar uma tarefa a uma história de usuário

As tarefas são etapas detalhadas específicas que são necessárias para concluir cada história de usuário. Depois de concluir todas as tarefas de uma história do usuário, a história do usuário deve ser concluída também.

Para adicionar uma tarefa a uma história de usuário, selecione o + próximo ao item de história de usuário e selecione tarefa. Preencha o título e outras informações na tarefa.

Add a Task to a User Story

Depois de criar recursos, histórias de usuários e tarefas, você pode exibi-los nos modos de exibição de pendências ou de placas para controlar seu status.

Backlogs view

Boards view

Usar um modelo de trabalho do Agile TDSP

Os cientistas de dados podem se sentir mais confortáveis usando um modelo ágil que substitui recursos, histórias de usuários e tarefas com estágios e subestágios do ciclo de vida de TDSP. No Azure Boards, você pode criar um modelo derivado de Agile que usa estágios de ciclo de vida TDSP para criar e acompanhar itens de trabalho. Os passos à seguir são um passo-a-passo para configurar o modelo de processo agile de ciência de dados específico e criar item de trabalho de ciência de dados com base no modelo.

Configure um modelo de processo de ciência de dados Agile

  1. Na página principal da organização DevOps do Azure, selecione configurações da organização no painel de navegação esquerdo.

  2. Nas configurações da organização navegação à esquerda, em placas, selecione processar.

  3. No painel todos os processos, selecione ... ao lado de Agilee, em seguida, selecione criar processo herdado.

    Create inherited process from Agile

  4. Na caixa de diálogo criar processo herdado do Agile, digite o nome AgileDataScienceProcesse selecione criar processo.

    Create AgileDataScienceProcess process

  5. Em todos os processos, selecione o novo AgileDataScienceProcess.

  6. Na guia tipos de item de trabalho, desabilite Epic, recurso, história de usuárioe tarefa selecionando o ... ao lado de cada item e, em seguida, selecionando desabilitar.

    Disable work item types

  7. Em todos os processos, selecione a guia níveis de pendências. Em rependências de portfólios, selecione ... ao lado de Epic (desabilitado)e, em seguida, selecione Editar/renomear.

  8. Na caixa de diálogo Editar nível de registro posterior:

    1. Em nome, substitua Epic por projetos TDSP.
    2. Em tipos de item de trabalho neste nível de registro posterior, selecione novo tipo de item de trabalho, insira projeto TDSPe selecione Adicionar.
    3. Em tipo de item de trabalho padrão, menu suspenso e selecione projeto TDSP.
    4. Selecione Salvar.

    Set Portfolio backlog level

  9. Siga as mesmas etapas para renomear recursos para estágios TDSPe adicione os seguintes novos tipos de item de trabalho:

    • Noções básicas sobre negócios
    • Aquisição de dados
    • Modelagem
    • Implantação
  10. Em pendências de requisito, renomeie as histórias para subestágios TDSP, adicione o novo subestágio TDSPdo tipo de item de trabalho e defina o tipo de item de trabalho padrão como subestágio TDSP.

  11. Em pendências de iteração, adicione um novo tipo de item de trabalho TDSP tarefae defina-o como o tipo de item de trabalho padrão.

Depois de completar destas etapas, os Níveis de registro posterior devem ser assim:

TDSP template backlog levels

Criar itens de trabalho do processo de ciência de dados Agile

Você pode usar o modelo de processo de ciência de dados para criar projetos do TDSP e acompanhar itens de trabalho que correspondem a estágios do ciclo de vida do TDSP.

  1. Na página principal da organização DevOps do Azure, selecione novo projeto.

  2. Na caixa de diálogo criar novo projeto, dê um nome ao projeto e selecione avançado.

  3. Em processo de item de trabalho, menu suspenso e selecione AgileDataScienceProcesse, em seguida, selecione criar.

    Create a TDSP project

  4. No projeto recém-criado, selecione quadros> dependências na navegação à esquerda.

  5. Para tornar os projetos do TDSP visíveis, selecione o ícone definir configurações da equipe. Na tela configurações, marque a caixa de seleção projetos TDSP e, em seguida, selecione salvar e fechar.

    Select TDSP Projects check box

  6. Para criar um projeto TDSP específico de ciência de dados, selecione projetos do TDSP na barra superior e, em seguida, selecione novo item de trabalho.

  7. No pop-up, dê um nome ao item de trabalho do projeto TDSP e selecione Adicionar à parte superior.

    Create data science project work item

  8. Para adicionar um item de trabalho no projeto TDSP, selecione o + próximo ao projeto e, em seguida, selecione o tipo de item de trabalho a ser criado.

    Select data science work item type

  9. Preencha os detalhes no novo item de trabalho e selecione Salvar e fechar&.

  10. Continue a selecionar os + símbolos ao lado de itens de trabalho para adicionar novos estágios, subestágios e tarefas do TDSP.

Veja um exemplo de como os itens de trabalho de projeto de ciência de dados devem ser exibidos na visualização do Backlogs:

18

Colaboradores

Esse artigo é mantido pela Microsoft. Ele foi originalmente escrito pelos colaboradores a seguir.

Autor principal:

Para ver perfis não públicos do LinkedIn, entre no LinkedIn.

Próximas etapas

  • Codificação colaborativa com Git descreve como fazer o desenvolvimento de colaboração de código para projetos de ciência de dados usando o Git como a estrutura de desenvolvimento de código compartilhado e como vincular essas atividades de codificação ao trabalho planejado com o processo do agile.

Recursos adicionais sobre processos Agile: