Lista de verificação de revisão de design para Excelência Operacional

Esta lista de verificação apresenta um conjunto de recomendações para o ajudar a criar uma cultura de excelência operacional. Comece com uma abordagem de DevOps para integrar especializações de várias disciplinas. Esta abordagem cria uma prática rigorosa de conceção e desenvolvimento. Esta abordagem leva a implementações repetíveis, fiáveis e seguras de infraestrutura e código.

Priorize a intervenção humana em áreas que dela beneficiam e incorpore a automatização noutras áreas. A observabilidade serve a excelência operacional ao monitorizar eventos de estado de funcionamento e também para validar a conceção e implementação da carga de trabalho atual para informar o desenvolvimento futuro do produto.

Se não considerar as vantagens e recomendações de excelência operacional, a carga de trabalho poderá estar em risco. Considere cuidadosamente os pontos abrangidos na seguinte lista de verificação para incutir confiança no sucesso da sua estrutura.

Lista de Verificação

  Código Recomendação
OE:01 Determine as especializações dos membros da equipa de carga de trabalho e integre-as num conjunto robusto de práticas para conceber, desenvolver, implementar e operar a carga de trabalho de acordo com a especificação. Os membros da equipa têm de ter clareza na tomada de decisões e responsabilidades, valorizar a melhoria e otimização contínuas e adotar uma cultura sem culpa que incorpore a aprendizagem contínua.
OE:02 Formalize a forma como executa tarefas operacionais de rotina, conforme necessário, e de emergência através da documentação, listas de verificação ou automatização. Procure consistência e previsibilidade para processos de equipa e materiais a entregar através da adoção de práticas e abordagens líderes do setor, como uma abordagem de mudança para a esquerda .
OE:03 Formalizar processos de planeamento e ideação de software. Desenhe a partir de normas de indústria e organizacionais estabelecidas. Utilize um registo de tarefas pendentes com prioridades comuns e especificações suficientemente detalhadas. Com base nos resultados, impulsione melhorias contínuas no seu processo de planeamento.
OE:04
OE:04
OE:04
Otimize o desenvolvimento de software e os processos de garantia de qualidade ao seguir as práticas comprovadas pela indústria para desenvolvimento e teste. Para designação de função inequívoca, uniformize práticas entre componentes como ferramentas, controlo de origem, padrões de conceção de aplicações, documentação e guias de estilo.
OE:05 Prepare os recursos e as respetivas configurações com uma abordagem de infraestrutura padronizada como código (IaC). Tal como outros códigos, crie IaC com estilos consistentes, modularização adequada e garantia de qualidade. Preferir uma abordagem declarativa sempre que possível.
OE:06 Crie uma cadeia de fornecimento de cargas de trabalho que impulsione as alterações propostas através de pipelines automatizados previsíveis. Os pipelines testam e promovem essas alterações em ambientes. Otimize uma cadeia de fornecimento para tornar a carga de trabalho fiável, segura, económica e eficaz.
OE:07
OE:07
Crie e implemente um sistema de monitorização para validar escolhas de design e informar futuras decisões empresariais e de design. Este sistema captura e expõe telemetria operacional, métricas e registos que emitem a partir da infraestrutura e código da carga de trabalho.
OE:08 Desenvolver uma prática eficaz de operações de emergência. Certifique-se de que a carga de trabalho emite sinais de estado de funcionamento significativos em toda a infraestrutura e código. Recolha os dados resultantes e utilize-os para gerar alertas acionáveis que decretam respostas de emergência através de dashboards e consultas. Defina claramente as responsabilidades humanas, tais como rotações de chamada, gestão de incidentes, acesso a recursos de emergência e execução de autópsias.
OE:09 Automatizar todas as tarefas que não beneficiam da perspicácia e da adaptabilidade da intervenção humana, são altamente processuais e têm um prazo de validade que gera um retorno sobre o investimento em automatização. Sempre que possível, selecione software off-the-shelf para automatização versus implementações personalizadas. Trate toda a automatização da mesma forma que os componentes da carga de trabalho e aplique os pilares do Well-Architected Framework à sua conceção e implementação.
OE:10 Crie e implemente a automatização antecipadamente para operações como problemas de ciclo de vida, bootstrapping e aplicação de proteções de governação e conformidade. Não tente reajustar a automatização mais tarde. Selecione as funcionalidades de automatização fornecidas pela sua plataforma.
OE:11 Defina claramente as práticas de implementação seguras da carga de trabalho. Realce os ideais de métodos de lançamento pequenos, incrementais e com porta de qualidade. Utilize padrões de implementação modernos e técnicas de exposição progressiva para controlar o risco. Conta para implementações de rotina e implementações de emergência ou correções.
OE:12 Implemente uma estratégia de mitigação de falhas de implementação que resolve problemas inesperados de implementação intermédia com a recuperação rápida. Combine várias abordagens, como reversão, desativação de funcionalidades ou utilização das capacidades nativas do padrão de implementação.

Passos seguintes

Recomendamos que reveja as desvantagens de Excelência Operacional para explorar outros conceitos.