Compartilhar via


Lista de verificação de revisão de design para Excelência em Operações

Esta lista de verificação apresenta um conjunto de recomendações para ajudá-lo a criar uma cultura de excelência operacional. Comece com uma abordagem de DevOps para integrar especializações de várias disciplinas. Essa abordagem cria uma prática rigorosa de design e desenvolvimento. Essa abordagem leva a implantações repetíveis, confiáveis e seguras de infraestrutura e código.

Priorize a intervenção humana em áreas que se beneficiam dela e incorpore a automação em outras áreas. A observabilidade contribui para a excelência operacional ao monitorar eventos de saúde e validar o design e a implementação da carga de trabalho atual, informando o desenvolvimento futuro do produto.

Se você não considerar compensações e recomendações para excelência operacional, sua carga de trabalho poderá estar em risco. Considere cuidadosamente os pontos abordados na lista de verificação a seguir para incutir confiança no sucesso do seu design.

Lista de Verificação

  Código Recomendação
OE:01 Defina suas práticas padrão para desenvolver e operar sua carga de trabalho. Promova uma cultura irrepreensível que enfatize o aprendizado contínuo e priorize a melhoria e a otimização contínuas.
OE:02 Formalize a maneira como você executa a rotina, conforme necessário, e as tarefas operacionais de emergência. Aumente a consistência e a previsibilidade adotando práticas e abordagens comprovadas pelo setor.
OE:03 Formalize os processos de ideação e planejamento de software. Baseie-se nos padrões estabelecidos do setor e da organização para comunicação em equipe, documentação de requisitos e design, e processos de desenvolvimento de software.
OE:04
OE:04
OE:04
aprimorar o desenvolvimento de software e a garantia de qualidade implementando práticas padrão do setor. Certifique-se de definições de função claras e processos consistentes padronizando ferramentas, controle do código-fonte, padrões de design, documentação e guias de estilo.
OE:05 Use uma abordagem de IaC (infraestrutura padronizada como código) para preparar recursos e configurações. Use IaC para garantir estilos consistentes, modularização e garantia de qualidade. Prefira abordagens declarativas em vez de imperativas quando práticas.
OE:06 Construa uma cadeia de suprimento de carga de trabalho que promova alterações por meio de pipelines automatizados e previsíveis. Confirme que esses pipelines testem e promovam alterações em todos os ambientes e portões de qualidade. Inclua testes abrangentes.
OE:07
OE:07
Projetar e implementar um sistema de monitoramento para capturar e expor telemetria, métricas e logs de sua infraestrutura e código. Use esses dados para validar as opções de design e orientar futuras decisões de design e negócios.
OE:08 Estabeleça uma prática de operações de emergência robusta. Crie um plano de resposta a incidentes que documente claramente funções, responsabilidades e todos os processos e procedimentos de resposta a emergências. Capture aprendizados por meio de análises pós-incidente e relatórios de incidentes para melhorar continuamente o plano e a carga de trabalho.
OE:09 Automatize tarefas repetitivas, processuais e forneçam um retorno claro sobre o investimento. Prefira ferramentas de automação fora da prateleira em vez de soluções personalizadas. Aplique os pilares do Well-Architected Framework ao design e à implementação de todos os esforços de automação.
OE:10 Projete e implemente automação desde o início para tarefas como gerenciamento do ciclo de vida, inicialização e governança. Evite readequar a automação mais tarde. Simplifique seu design adotando a funcionalidade de automação nativa da plataforma.
OE:11 Defina claramente as práticas de implantação seguras da carga de trabalho. Concentre-se em lançamentos pequenos e incrementais com portões de qualidade. Use padrões de implantação modernos e exposição progressiva para gerenciar riscos. Planeje implantações de rotina e emergência.
OE:12 Implementar uma estratégia de mitigação de falhas de implantação para lidar com problemas inesperados durante a distribuição. Use abordagens como reversão, desabilitação de recursos ou as funcionalidades nativas do padrão de implantação para recuperação rápida.

Próximas etapas

Recomendamos que você examine as compensações de Excelência operacional para explorar outros conceitos.