Partilhar via


Prepare suas operações de nuvem do Azure

Este artigo ajuda você a estabelecer e manter operações eficazes para gerenciar seu patrimônio de nuvem do Azure. Operações de nuvem bem-sucedidas exigem responsabilidades e processos claramente definidos para cada área de gerenciamento de nuvem.

Diagrama que mostra o processo CAF Manage: preparar, gerir, monitorizar e proteger (RAMP).

Identificar as suas responsabilidades de gestão

Gerenciar efetivamente seu ambiente do Azure envolve responsabilidades centrais (em toda a plataforma) e responsabilidades de carga de trabalho. As responsabilidades centrais dão suporte a todo o seu patrimônio de nuvem do Azure. As responsabilidades da carga de trabalho concentram-se numa carga de trabalho individual. Use a Tabela 1 para garantir que as suas operações considerem as responsabilidades essenciais de operações na nuvem.

Tabela 1. Principais responsabilidades de gerenciamento de nuvem

Áreas de gestão na nuvem Responsabilidades centrais Responsabilidades relacionadas à carga de trabalho
Conformidade ▪ Definir procedimentos operacionais.
▪ Aplicar políticas de governança.
Monitore a conformidade e corrija ou escale conforme necessário.
▪ Siga os procedimentos operacionais.
▪ Alinhe o design com as políticas de governança.
Segurança ▪ Gerencie operações de segurança em toda a organização.
▪ Gerencie identidades no Microsoft Entra ID.
▪ Conceda acesso às assinaturas do Azure.
▪ Defina e mantenha linhas de base de segurança por meio da Política do Azure e do Microsoft Defender for Cloud.
▪ Supervisione a proteção contra ameaças e a integração da resposta a incidentes com o Microsoft Sentinel.
▪ Implemente um design de carga de trabalho seguro.
▪ Responda a alertas e incidentes de segurança específicos da carga de trabalho.
▪ Avalie continuamente as vulnerabilidades dentro da carga de trabalho.
Gestão de recursos ▪ Definir e manter a hierarquia de recursos.
▪ Crie assinaturas de carga de trabalho conforme solicitado.
▪ Defina a estratégia de nomenclatura e marcação.
▪ Defina a topologia de rede.
▪ Configure a rede compartilhada (emparelhamento de rede virtual, conectividade local).
▪ Gerencie cargas de trabalho cruzadas ou recursos/serviços compartilhados.
▪ Monitore os limites de assinatura e trate de solicitações de aumento de cota.
▪ Gerencie assinaturas específicas da carga de trabalho (se delegadas).
▪ Gerir grupos de recursos e recursos para cada carga de trabalho.
▪ Aderir e aplicar padrões de nomenclatura e marcação.
▪ Gerencie a utilização de recursos no nível do aplicativo, garantindo que os recursos permaneçam dentro das cotas de assinatura.
Implantação ▪ Padronize e administre pipelines e ferramentas de CI/CD (Azure DevOps, GitHub Actions).
▪ Definir modelos de infraestrutura de referência como código (modelos Bicep, Terraform, ARM).
▪ Fornecer práticas recomendadas centrais para a segurança do pipeline (verificação de código, gerenciamento de segredos).
▪ Use a estrutura CI/CD central e os modelos IaC para implantações de carga de trabalho.
▪ Implementar tarefas de implantação específicas da carga de trabalho (definir configurações do aplicativo, banco de dados).
▪ Adaptar os modelos de referência às necessidades de carga de trabalho, respeitando as diretrizes centrais.
Desenvolvimento ▪ Fornecer e aplicar cadeias de ferramentas e estruturas de desenvolvimento padronizadas para acelerar a consistência (padrões de codificação, práticas recomendadas de DevOps).
▪ Mantenha repositórios internos ou feeds de pacotes para bibliotecas ou módulos compartilhados.
▪ Adote e adapte cadeias de ferramentas padrão para o desenvolvimento da carga de trabalho.
▪ Possuir o ciclo de vida do aplicativo e incorporar práticas recomendadas (teste de unidade, teste de integração).
▪ Gerencie a melhoria contínua da base de código da carga de trabalho.
Monitorização Planeie a estratégia de monitorização.
Alerta sobre responsabilidades centralizadas.
▪ Forneça painéis para métricas operacionais comuns em todo o ambiente.
▪ Monitorar a carga de trabalho
▪ Estenda ou ajuste os alertas centrais para capturar condições específicas da carga de trabalho.
▪ Investigue e corrija incidentes no nível da carga de trabalho com base em alertas e logs.
Custo ▪ Aloque orçamentos de nuvem globais ou de nível de assinatura
▪ Monitore os gastos na nuvem em toda a organização e crie relatórios de custos.
▪ Aloque custos para unidades de negócios ou produtos, normalmente usando tags ou modelos personalizados de alocação de custos.
▪ Aplique a estratégia de marcação para alocação de custos.
▪ Projeto de carga de trabalho com otimização de custos
▪ Respeite as restrições orçamentais.
Fiabilidade ▪ Defina requisitos de confiabilidade (SLO, RPO, RTO) por prioridade de carga de trabalho.
▪ Fornecer orientação sobre continuidade de negócios e recuperação de desastres (BCDR).
▪ Gerencie soluções centralizadas de recuperação de desastres .
▪ Ofereça suporte ao gerenciamento de incidentes graves em todas as cargas de trabalho.
▪ Projete a carga de trabalho para atender aos requisitos de confiabilidade.
Desempenho ▪ Monitore e mantenha o desempenho em componentes centralizados (rede de hub, serviços compartilhados).
▪ Fornecer diretrizes para otimização de desempenho e planejamento de capacidade.
▪ Monitorar cota
▪ Projete a carga de trabalho para eficiência de desempenho.

Estabeleça suas operações na nuvem

Use as responsabilidades descritas na Tabela 1 para construir uma base operacional eficaz. Defina claramente equipes, padrões e processos seguindo estas etapas:

  1. Defina seu modelo de operações na nuvem. Escolha um modelo de gestão centralizado ou partilhado com base na dimensão e maturidade da sua organização, descrito na tabela seguinte:

    Abordagem de operações Responsabilidades e âmbito de aplicação Melhor para Vantagens Desvantagens
    Centralizado Uma única equipa gere todas as tarefas. Startups ou pequena infraestrutura na nuvem. Simplifica o gerenciamento de nuvem. Corre-se o risco de criar estrangulamentos.
    Gestão partilhada Separe as equipas centrais (plataforma) e de trabalho Organizações com cargas de trabalho diversas. Equilibra governança e agilidade. Requer uma clara atribuição de responsabilidade
  2. Estabelecer responsabilidades centrais. Forme uma equipe dedicada para lidar com tarefas de gerenciamento central. Desenvolver uma matriz de competências a partir da Tabela 1 para identificar os conhecimentos necessários.

  3. Estabeleça responsabilidades de carga de trabalho. Configure equipes especializadas para tarefas específicas da carga de trabalho. Identifique as responsabilidades usando a Tabela 1 e, em seguida, recrute de acordo.

    • Conduza uma revisão do Well-Architected do Azure. Use a ferramenta Avaliação deWell-Architected para reavaliar cada carga de trabalho enquanto desenvolve e testa alterações de projeto.

    • Use o Azure Well-Architected Framework. Use o pilar Excelência operacional para orientar suas responsabilidades de gerenciamento de carga de trabalho.

  4. Atribua responsabilidades. Nomeie proprietários específicos para todas as responsabilidades de gerenciamento de nuvem. Em um modelo de gerenciamento compartilhado, as equipes de carga de trabalho devem ter autonomia para gerenciar suas assinaturas.

Documente as suas operações na nuvem

Documente claramente suas operações na nuvem para permitir uma resposta eficiente a crises e uma implementação suave de mudanças. Estabeleça procedimentos abrangentes e crie guias detalhados para tarefas frequentes e específicas.

Documentar os procedimentos operacionais

Defina procedimentos operacionais para gerenciar mudanças, recuperação de desastres e tarefas de manutenção de rotina que a automação não pode lidar. Siga estes passos:

  1. Definir procedimentos de gestão de mudanças. A mudança é a principal causa de falha na nuvem. Desenvolva um processo padronizado para gerenciar alterações para evitar falhas em seu ambiente de nuvem. Consulte Gerir alterações.

  2. Definir procedimentos de implantação (gerenciamento de versão). Para manter uma configuração consistente, padronize suas implantações, versões e promoções de ambiente. Consulte Gerenciar implantações.

  3. Defina procedimentos de recuperação de desastres e continuidade de negócios. Para lidar com possíveis falhas, prepare um plano de resposta padronizado. Consulte Gerenciar recuperação de desastres e continuidade de negócios.

  4. Definir procedimentos adicionais. Documente processos para gerenciar solicitações de serviço, aplicação de patches e gerenciamento de configuração. Documente claramente esses processos para garantir que as partes interessadas saibam como iniciar ou concluir cada tarefa.

Documentar guias operacionais

Crie guias passo a passo detalhados (livros de operações ou manuais de procedimentos) para as principais tarefas operacionais. Essa preparação garante uma execução consistente, melhora a eficiência e reduz os tempos de resolução durante eventos críticos.

  1. Defina tarefas diárias. Prepare manuais que abranjam responsabilidades diárias, como solicitações de escalonamento de privilégios e revisões de log. Estabeleça procedimentos operacionais padrão (POPs) para monitorar métricas, limites de alerta e painéis para cada sistema.

  2. Crie uma biblioteca de runbooks centrados no Azure. Crie runbooks específicos do Azure abordando cenários como:

    Cenário Exemplo
    Uso elevado de CPU Gerenciar a expansão no Serviço de Aplicativo do Azure
    Alternância e reversão Failover e failback no Azure Site Recovery
    Implantações azuis/verdes Implantação azul/verde no Azure Front Door
    Restauração de backup Restauração de backup no Armazenamento de Blobs do Azure e no Azure Cosmos DB
  3. Armazene estes manuais de execução num repositório central. Mantenha os manuais de execução num repositório central acessível por engenheiros de serviço para uso imediato durante incidentes.

  4. Implementar operações programaticamente. Integre a infraestrutura como código em seus runbooks para implantar recursos comuns de forma consistente e precisa sempre.

  5. Revisão e atualização. Revise e revise periodicamente a documentação para refletir os ajustes operacionais e as atualizações do serviço de nuvem.

Ferramentas e soluções documentais

A documentação clara garante consistência, reduz os riscos operacionais e aumenta a eficiência da equipe. Crie e mantenha documentação abrangente para ferramentas na nuvem. Atualize regularmente a documentação para refletir as práticas atuais e garantir fácil acessibilidade para todos os membros da equipe.

Área Exemplos de benefícios
Integração A padronização simplifica as integrações consolidando logs e repositórios de código.
Automação Reutilize modelos de IaC em equipes, scripts de automação e práticas recomendadas em projetos.
Gestão de incidentes Capture problemas e gere ações de correção que se integram aos ciclos de lançamento.

Gerencie suas operações na nuvem

O gerenciamento eficaz da nuvem otimiza a eficiência operacional, reduz o tempo de inatividade e esclarece funções e responsabilidades. Padronize suas operações na nuvem por meio de processos de automação e suporte estruturado. Siga estas orientações operacionais:

  • Forneça suporte contínuo na nuvem. Estabeleça uma cobertura de suporte 24 horas por dia, 7 dias por semana, por meio de equipes globais que adotam um modelo "follow-the-sun" ou rotações estruturadas de plantão. Definir responsabilidades de forma clara para garantir uma resposta atempada e a resolução de incidentes críticos. Configure alertas automatizados para notificar imediatamente o pessoal de suporte designado.

  • Automatize o trabalho repetitivo. Use os recursos de automação do Azure para minimizar processos manuais e reduzir a sobrecarga operacional. Automatize atividades de rotina para eliminar erros, simplificar fluxos de trabalho e permitir que as equipes se concentrem em prioridades estratégicas.

    Caso de uso Exemplos
    Automação Automatize fluxos de trabalho no Azure Boards ou no sistema ITSM. Modelos para itens de trabalho "Solicitação de alteração" e "Incidente".
    Resposta a incidentes Para gerar automaticamente tíquetes de incidentes com campos padrão preenchidos, integre o Azure Monitor e o Azure Service Health ao sistema de tíquetes.
    Gestão da mudança Use os Aplicativos Lógicos do Azure para aprovar automaticamente alterações de baixo risco ou corrigir automaticamente determinados incidentes.
    Conformidade Use a Política do Azure para impor e monitorar a conformidade com a nuvem.
    Segurança Use o Microsoft Defender for Cloud e o Microsoft Sentinel para automatizar a deteção e a resposta a ameaças de segurança. Use o Microsoft Entra ID Governance para revisar permissões e automatizar o gerenciamento de permissões.

Melhorar as operações

Otimize seu ambiente de nuvem do Azure promovendo a melhoria contínua. Avalie regularmente as operações e priorize a aprendizagem contínua e o feedback. Siga estes passos:

  1. Rever as operações para melhorar. Siga as práticas recomendadas para monitorar a integridade, conformidade, segurança, custos, dados e recursos de nuvem. Realize revisões operacionais semanais para discutir as principais métricas, incidentes recentes, alterações implantadas e riscos previstos. Abordar ativamente a expansão de recursos e a dívida técnica.

  2. Treinar para operações. Promover o desenvolvimento contínuo de competências, priorizando recursos de aprendizagem essenciais. Mantenha operações dinâmicas na nuvem por meio de ambientes de treinamento práticos. A tabela a seguir fornece recursos para treinamento de operações.

    Treinamento de operações Descrição
    Obter credenciais Defina metas para credenciais da Microsoft, como habilidades aplicadas e Certificações Microsoft para desenvolver conhecimento.
    Utilizar recursos operacionais Consulte Recursos de gerenciamento do Azure.
    Utilizar a documentação do produto Use o Microsoft Learn para encontrar orientação sobre os serviços do Azure.
    Obtenha prática prática Incentive a prática prática em ambientes de sandbox que não sejam de produção.

Recursos de gerenciamento do Azure

Categoria Recurso de gestão Descrição
Conformidade CAF Governação Estrutura de governança de nuvem da Microsoft
Segurança Gerenciar operações de segurança Orientações para gerir operações de segurança
Segurança Ferramenta de segurança da Microsoft Uma lista de ferramentas de segurança da Microsoft e do Azure
Segurança Segurança da carga de trabalho Orientação de carga de trabalho para segurança
Gestão de recursos Estratégia de nomenclatura e marcação Recomendações de nomenclatura e marcação para gerenciar recursos
Gestão de recursos Abreviatura do Azure Lista de abreviaturas para recursos do Azure
Gestão de recursos Assistente do Azure Um assistente digital para alinhar com as práticas recomendadas do Azure.
Gestão de recursos Regras de nomenclatura do Azure Regras de nomenclatura para todos os recursos do Azure
Gestão de recursos Guias de serviço do Azure Orientação para decisões de configuração de serviço
Desenvolvimento Desenvolvimento de software de carga de trabalho Orientação de carga de trabalho para desenvolvimento de software
Desenvolvimento Centro de Arquitetura do Azure Arquiteturas e guias para diferentes casos de uso
Desenvolvimento Hub de recursos do desenvolvedor Um hub para ferramentas e recursos de desenvolvedor
Implantação Modelos de bíceps, Terraform e ARM Modelos IaC para cada recurso do Azure
Implantação Pares de região do Azure Lista de regiões emparelhadas do Azure
Implantação Diretório dos Serviços de Nuvem do Azure Diretório de todos os serviços do Azure
Implantação Implantação de carga de trabalho Orientação da carga de trabalho para integração contínua
Monitorização Monitorize o seu ambiente na nuvem Azure Diretrizes abrangentes de monitoramento do Azure
Monitorização Monitoramento da carga de trabalho Orientações sobre a carga de trabalho para monitorização
Custo Gerir os custos Orientação para a gestão de custos
Custo Otimização de custos de carga de trabalho Orientação da carga de trabalho para otimização de custos
Fiabilidade Gerencie a confiabilidade dos dados Orientações para manter a fiabilidade dos dados
Fiabilidade Gerencie a confiabilidade dos recursos da nuvem Orientações para manter a fiabilidade dos recursos
Fiabilidade Gerenciar incidentes de segurança Recomendações para responder a incidentes de segurança
Desempenho Eficiência no desempenho da carga de trabalho Orientação da carga de trabalho para eficiência de desempenho

Próximos passos