Share via


Recomendações para formalizar tarefas de rotina e não rotina

Aplica-se a esta recomendação de lista de verificação de Excelência Operacional do Azure Well-Architected Framework:

OE:02 Formalize a maneira como você executa a rotina, conforme necessário, e as tarefas operacionais de emergência usando documentação, listas de verificação ou automação. Busque consistência e previsibilidade para processos de equipe e entregas adotando práticas e abordagens líderes do setor, como uma abordagem de mudança para a esquerda.

Este guia descreve as recomendações para formalizar tarefas de rotina e não rotina. As equipes de carga de trabalho eficientes e bem-sucedidas têm práticas de gerenciamento de carga de trabalho consistentes e previsíveis. Otimize a eficiência e a consistência adotando ferramentas e práticas comprovadas do setor e automatizando processos quando for prático. Ao ser consistente sobre como as tarefas rotineiras, improvisadas e de emergência são tratadas, você minimiza o risco de despreparo quando surgem problemas. Ao adotar uma abordagem de melhoria contínua para o gerenciamento de carga de trabalho, você aumenta a consistência e a eficiência da sua equipe em todo o ciclo de vida da carga de trabalho.

Principais estratégias de design

Processos consistentes tornam sua qualidade de trabalho previsível e a qualidade de trabalho previsível torna o suporte à carga de trabalho mais suave. Para obter consistência em seus processos, você precisa ser intencional e explícito sobre como executar processos em padrões padrão. Use estratégias como automação e abordagens shift-left para minimizar possíveis áreas de imprevisibilidade.

A padronização do processo usa muitas formas. Descrever todas as maneiras pelas quais você pode abordar a padronização está fora do escopo deste guia, mas algumas recomendações gerais incluem:

  • Os processos padronizados devem abranger todos os aspectos do gerenciamento de carga de trabalho: confiabilidade, segurança, otimização de custos, desempenho e processos operacionais. A equipe de carga de trabalho deve ter tanta propriedade dos processos quanto precisar para manter e melhorar continuamente a carga de trabalho sob a governança geral da organização.

  • A documentação que você produz captura seus procedimentos operacionais padrão e determina como as coisas são feitas, mas a documentação nunca é final. Os procedimentos devem evoluir à medida que sua carga de trabalho e sua equipe evoluem. Revise regularmente e desafie os padrões para garantir que eles sejam os padrões certos para sua equipe no momento. Sua documentação deve ser modelada e controlada por versão para garantir a consistência nos formatos de documentação e que haja um registro de revisões e atualizações. O controle de versão também ajuda a reforçar os requisitos de que a equipe realiza revisões da documentação em intervalos agendados regularmente.

  • Divida tarefas de rotina, improvisadas e de emergência em itens de lista de verificação que são fáceis de entender. Um exemplo de uma tarefa de rotina é o processo de aplicação de uma atualização a uma dependência de software livre. A carga de trabalho pode precisar usar uma biblioteca de software livre como um SDK para usar um serviço de mensagens de terceiros. Esse SDK deve ser atualizado regularmente para patches de segurança, correções de bugs e aprimoramentos de funcionalidade.

    Quando você determina que precisa de uma atualização, a equipe de carga de trabalho pode ter uma lista de verificação que inclui itens como testar a atualização em ambientes inferiores, criar uma solicitação de gerenciamento de alterações para implantar a atualização em produção e atualizar a documentação, como um wiki ou base de dados de conhecimento, para garantir que eles reflitam a versão correta. Concentre cada item de lista de verificação em uma tarefa discreta claramente definida.

  • As tarefas improvisadas e de emergência são específicas do cenário, mas os operadores ainda devem entender claramente suas funções e responsabilidades. Eles precisam saber como interagir com a equipe de carga de trabalho e com outras equipes da organização para trabalhar com eficiência nesses tipos de tarefas.

    Por exemplo, uma tarefa improvisada pode implantar um novo tipo de recurso, como um serviço de machine learning, que foi aprovado para aprimorar a funcionalidade da carga de trabalho. Pode não haver uma lista de verificação totalmente realizada para a implantação e o teste desse tipo de recurso. No entanto, deve haver listas de verificação gerais para adicionar novos recursos à sua infraestrutura como modelos de código e padrões que abrangem testes de infraestrutura para desempenho, segurança e confiabilidade em cada estágio da cadeia de promoção.

    Da mesma forma, seu plano de resposta a emergências deve definir claramente funções e responsabilidades e processos e procedimentos gerais. Você deve aderir a esse plano em situações de emergência para garantir que você os manipule com eficiência.

    Operações improvisadas e de emergência também são boas oportunidades para aprender a melhorar seus procedimentos operacionais padrão. Peça à equipe de carga de trabalho para refletir sobre as maneiras pelas quais as operações poderiam ter sido mais suaves e determinar se uma atualização para os processos existentes poderia ser benéfica daqui para frente.

  • Adote práticas comprovadas do setor para minimizar o tempo que sua equipe gasta ao inventar processos e padrões. Seguir as práticas Agile com Scrum, organizar seu trabalho por meio de quadros Kanban e adotar um ethos shift-left são todos exemplos de práticas que foram desenvolvidas ao longo de muitos anos e foram comprovadamente eficazes para organizações de qualquer tamanho. Muitas organizações maduras usam procedimentos operacionais padrão controlados por versão, wikis, novos manuais de funcionários e manuais de operações para impor consistência.

    Conte com a experiência da sua equipe para decidir quais práticas se encaixam no gerenciamento do ciclo de vida da carga de trabalho. Saiba mais com outras equipes sobre os padrões que eles implementaram com êxito para entender como práticas específicas se encaixam em sua estrutura organizacional.

    Nesse contexto, um ethos shift-left significa que as equipes de carga de trabalho devem ser capacitadas a procurar medidas que possam melhorar a segurança, a confiabilidade e a eficiência de custos da carga de trabalho. Em seguida, eles adicionam essas medidas de melhoria à sua própria lista de pendências, em vez de mudar a responsabilidade para equipes externas.

    Por exemplo, um teste exploratório pode descobrir uma área para melhorar a segurança que pode não ter sido descoberta até que ela seja exposta por verificações de segurança, que ocorrem mensalmente ou até menos com menos frequência. Incentive a equipe de carga de trabalho a assumir a propriedade da carga de trabalho em todos os aspectos de seu ciclo de vida e contribuir para sua melhoria contínua proativamente, em vez de depender de outras equipes.

  • Incorpore requisitos organizacionais e funções transversais em seus procedimentos operacionais padrão. Sua organização pode ter padrões para alguns processos que você deve adotar. No entanto, você também pode ser capacitado a desenvolver seus próprios padrões para outros processos, portanto, procure maneiras de incorporar os padrões necessários em seus processos. Os processos que você possui provavelmente se cruzam com os processos de outras equipes, portanto, procure alinhar os padrões a uma extensão viável.

    Documente onde os processos da equipe de carga de trabalho e de outras equipes divergem para garantir que a equipe de carga de trabalho possa trabalhar melhor com outras equipes quando houver pontos de interseção. As equipes de segurança central podem usar ferramentas e procedimentos diferentes da equipe de carga de trabalho, e as equipes podem colaborar mais facilmente se estiverem cientes dessas diferenças.

  • Incorpore os requisitos de conformidade aos procedimentos operacionais padrão. Dependendo do setor e das regiões em que você opera, pode haver requisitos rígidos sobre como executar e documentar tarefas. Certifique-se de entender e incorporar esses requisitos enquanto cria seus padrões. Treine regularmente a equipe de carga de trabalho nesses requisitos.

  • Use a automação para ajudar a obter consistência. Automatize tarefas que são repetitivas e propensas a erros humanos para aliviar a carga de gerenciamento de sua equipe. Procure oportunidades para automatizar processos, como gerar tíquetes de ITSM, por exemplo. Para obter mais informações, consulte as Recomendações para implementar a automação.

  • Seja intencional sobre sua abordagem para a adoção de software livre. Padronizar as regras sobre quando o uso de ferramentas de software livre é permitido e garantir que você se alinhe aos requisitos organizacionais e de conformidade. Talvez você queira criar padrões sobre os contribuições dos membros da equipe de carga de trabalho para projetos de software livre e decidir se deseja abrir seu código interno para outras equipes de desenvolvimento na organização.

Compensação: codificar procedimentos operacionais padrão pode levar ao risco de levar à estagnação ou complacência. Os padrões devem ser seguidos, mas não devem ser rígidos ou estáticos. Esforce-se para encontrar um equilíbrio entre a adesão estrita e a concessão de inovação para que seus processos possam evoluir com segurança ao longo do tempo.

Facilitação do Azure

Embora não haja produtos do Azure que facilitem diretamente a formalização de processos e procedimentos, a Microsoft publica muitas diretrizes sobre este tópico. Use estas diretrizes para entender as práticas comprovadas e recomendadas do setor e considerar como aplicá-las à sua carga de trabalho.

O Well-Architected Framework também fornece diretrizes detalhadas sobre os processos e procedimentos que devem ser codificados para garantir que a carga de trabalho e a equipe de carga de trabalho sejam executadas de acordo com os padrões do setor.

Lista de verificação de Excelência Operacional

Consulte o conjunto completo de recomendações.