Aplicar princípios de design e operações avançadas

As três primeiras disciplinas de gerenciamento de nuvem descrevem uma linha de base de gerenciamento. No mínimo, uma linha de base de gerenciamento deve incluir um compromisso de negócios padrão para minimizar as interrupções de negócios e acelerar a recuperação em caso de interrupção do serviço. A maioria das linhas de base de gerenciamento inclui um foco disciplinado na manutenção de inventário e visibilidade, além de conformidade operacional, proteção e recuperação.

A finalidade de uma linha de base de gerenciamento é criar uma oferta consistente que forneça um nível mínimo de compromisso de negócios para todas as cargas de trabalho com suporte. Essa linha de base de ofertas de gerenciamento comuns e replicáveis permite que a equipe ofereça gerenciamento operacional altamente otimizado com o mínimo de desvio. No entanto, essa oferta padrão pode não fornecer um compromisso suficientemente avançado com os negócios.

O diagrama na próxima seção ilustra três maneiras de ir além da linha de base de gerenciamento.

A linha de base de gerenciamento deve atender ao compromisso mínimo exigido por 80% das cargas de trabalho de menor criticidade do portfólio. Ela não deve ser aplicada a cargas de trabalho críticas. Também não deve ser aplicada a plataformas comuns compartilhadas entre cargas de trabalho. Essas cargas de trabalho exigem foco em princípios de design e operações avançadas.

Opções de operações avançadas

Há três caminhos sugeridos para melhorar os compromissos de negócios além da linha de base de gerenciamento, conforme mostrado no seguinte diagrama:

Operações avançadas

Linha de base de gerenciamento aprimorada

Conforme descrito no Guia de Gerenciamento do Azure, uma linha de base de gerenciamento aprimorada usa ferramentas nativas de nuvem para melhorar o tempo de atividade e diminuir os tempos de recuperação. As melhorias são significativas, mas menores do que o obtido com a especialização da carga de trabalho ou da plataforma. A vantagem de uma linha de base de gerenciamento aprimorada é a redução igualmente significativa no custo e no tempo de implementação.

Especialização de gerenciamento

Aspectos da carga de trabalho e das operações da plataforma podem exigir alterações nos princípios de arquitetura e design. Essas alterações podem levar tempo e resultar em aumento das despesas operacionais. Para reduzir o número de cargas de trabalho que exigem esses investimentos, uma linha de base de gerenciamento aprimorada poderia fornecer um aperfeiçoamento suficiente para o compromisso de negócios.

Para cargas de trabalho que garantem um investimento maior para atender a um compromisso de negócios, a especialização das operações é fundamental.

Áreas de especialização de gerenciamento

Há duas áreas de especialização:

  • Especialização de plataforma: invista em operações contínuas de uma plataforma compartilhada, distribuindo o investimento entre várias cargas de trabalho.
  • Especialização de carga de trabalho: invista em operações contínuas de uma carga de trabalho específica, geralmente reservada para cargas de trabalho críticas.

Equipe central de TI ou CCoE (centro de excelência em nuvem)

As decisões entre a especialização da plataforma e da carga de trabalho são baseadas na criticidade e no impacto de cada carga de trabalho. No entanto, essas decisões também são indicativas de decisões culturais mais amplas entre a equipe central de TI e os modelos organizacionais do CCoE.

A especialização de carga de trabalho geralmente aciona uma mudança cultural. A TI tradicional e a TI centralizada criam processos que podem dar suporte em escala. O suporte em escala é mais viável para os serviços replicáveis encontrados em uma linha de base de gerenciamento, em uma linha de base aprimorada ou até mesmo em operações de plataforma. A especialização de carga de trabalho não costuma ocorrer em escala. Com essa falta de escala, uma organização de TI centralizada tem dificuldade para dar o suporte necessário sem atingir as limitações de escala organizacional.

Como alternativa, uma abordagem de centro de excelência em nuvem é dimensionada por meio da delegação intencional de responsabilidade e centralização seletiva. A especialização de carga de trabalho tende a se alinhar melhor à abordagem de responsabilidade delegada de um CCoE.

O alinhamento natural das funções em um CCoE é descrito da seguinte maneira:

  • A equipe de plataforma de nuvem ajuda a criar plataformas comuns que dão suporte a várias equipes de adoção de nuvem.
  • A equipe de automação de nuvem estende essas plataformas para ativos implantáveis em um catálogo de serviços.
  • O gerenciamento de nuvem fornece a linha de base de gerenciamento centralmente e ajuda a dar suporte ao uso do catálogo de serviços.
  • No entanto, a unidade de negócios (na forma de uma equipe de DevOps empresarial ou de adoção de nuvem) é responsável pelas operações diárias de carga de trabalho, pipeline ou desempenho.

Quanto ao alinhamento de áreas de gerenciamento, a equipe central de TI e os modelos do CCoE geralmente podem oferecer especialização de plataforma, com alteração cultural mínima. A oferta da especialização de carga de trabalho pode ser mais complexa para as equipes centrais de TI.

Processos de especialização de gerenciamento

Em cada especialização, o processo de quatro etapas a seguir é fornecido em uma abordagem iterativa e disciplinada. Essa abordagem requer a parceria entre os especialistas em adoção de nuvem, plataforma de nuvem, automação de nuvem e gerenciamento de nuvem para criar um loop de comentários viável e informado.

  • Melhorar o design do sistema: aprimore o design de sistemas comuns (plataformas) ou cargas de trabalho específicas para minimizar efetivamente as interrupções.
  • Automatizar a correção: algumas melhorias não são econômicas. Nesses casos, pode fazer mais sentido automatizar a correção e reduzir o impacto das interrupções.
  • Dimensionar a solução: ao melhorar a correção automatizada e o design de sistemas, é possível dimensionar essas alterações em todo o ambiente por meio do catálogo de serviços.
  • Melhoria contínua: é possível usar várias ferramentas de monitoramento para descobrir melhorias incrementais a abordar na próxima etapa do design, da automação e do dimensionamento do sistema.

Melhorar o design do sistema

Melhorar o design do sistema é a abordagem mais eficaz para melhorar operações de qualquer plataforma comum. As melhorias de design do sistema podem ajudar a aumentar a estabilidade e diminuir as interrupções de negócios. O design de sistemas individuais está fora do escopo da exibição de ambiente obtido em todo o Cloud Adoption Framework.

Como complemento a essa estrutura, a Estrutura Bem Projetada do Microsoft Azure oferece princípios de orientação para aprimorar a qualidade de uma plataforma ou de uma carga de trabalho específica. A estrutura se concentra na melhoria em cinco pilares de excelência em arquitetura:

  • Otimização de custos: Gerenciar custos para maximizar o valor entregue.
  • Excelência operacional: Seguir processos operacionais que mantêm um sistema em execução em produção.
  • Eficiência de desempenho: Dimensionar sistemas para se adaptar às alterações na carga.
  • Confiabilidade: Projetar sistemas para se recuperar de falhas e continuar funcionando.
  • Segurança: Proteger aplicativos e dados contra ameaças.

A maioria das interrupções de negócios equivale a alguma forma de dívida técnica ou deficiência na arquitetura. Para implantações existentes, as melhorias no design dos sistemas podem ser exibidas como pagamentos com relação à dívida técnica existente. Para novas implantações, as melhorias no design dos sistemas podem ser exibidas como prevenção de dívida técnica. A próxima seção mostra como lidar com dívidas técnicas que não podem ou não devem ser resolvidas.

Para melhorar o design do sistema, saiba mais sobre o Well-Architected Framework do Microsoft Azure. À medida que o design do sistema for aprimorado, volte a este artigo para encontrar novas oportunidades de melhorar e dimensionar esses aprimoramentos no ambiente.

Correção automatizada

Algumas dívidas técnicas não podem ou não devem ser resolvidas. A resolução pode ser muito cara para corrigir. Ela pode ser planejada, mas o projeto pode ter uma longa duração. A interrupção dos negócios pode não resultar em impacto significativo ou a prioridade da empresa pode ser recuperar-se rapidamente em vez de investir em resiliência.

Quando a resolução da dívida técnica não for o caminho desejado, a correção automatizada será comumente a próxima etapa desejada. Usar a Automação do Azure e o Azure Monitor para detectar tendências e fornecer correção automatizada é a abordagem mais comum para a correção automatizada.

Para obter orientação sobre correção automatizada, consulte Alertas e Automação do Azure.

Dimensionar a solução com um catálogo de serviços

A base da especialização e das operações de plataforma é um catálogo de serviços bem gerenciado. É assim que as melhorias no design dos sistemas e na correção são dimensionadas em um ambiente. A equipe da plataforma de nuvem e a equipe de automação de nuvem se alinham para criar soluções reproduzíveis para as plataformas mais comuns em qualquer ambiente. No entanto, se essas soluções não forem aplicadas de maneira consistente, o gerenciamento de nuvem pode acabar oferecendo pouco mais do que uma oferta básica.

Para maximizar a adoção e minimizar a sobrecarga de manutenção de qualquer plataforma otimizada, a plataforma deve ser adicionada a um catálogo de serviços. Cada aplicativo no catálogo pode ser implantado para consumo interno por meio do catálogo de serviços ou como uma oferta de marketplace para consumidores externos.

Para saber como publicar em um catálogo de serviços, confira a série de artigos sobre como publicar em um catálogo de serviços.

Melhoria contínua

A especialização de plataforma e as operações de plataforma dependem de loops de comentários fortes entre as equipes de adoção, de plataforma, de automação e de gerenciamento. A fundamentação desses loops de comentários em dados capacita cada equipe a tomar decisões sábias. Para que as operações da plataforma obtenham compromissos de negócios de longo prazo, é importante usar insights específicos para a plataforma centralizada. Como os contêineres e o SQL Server são as duas plataformas gerenciadas centralmente mais comuns, considere começar com a coleta de dados de melhoria contínua revisando os seguintes artigos: