Observabilidade no monitoramento de nuvem
Este artigo faz parte de uma série no guia de monitoramento de nuvem.
As seções abaixo visam impulsionar a maturidade operacional, sendo observadoras e iterando constantemente para melhorar a forma como você monitora seus serviços. Saiba como as organizações implementam uma estratégia de monitoramento consistente mais rapidamente, estabelecendo observabilidade para cada solução de monitoramento.
Definição de observabilidade
Embora a observabilidade e o monitoramento se complementem, há uma distinção notável:
- Monitoramento: Coleta informações e informa que detetou um problema com base na configuração para monitorar essas condições. Você está monitorando falhas conhecidas ou previsíveis.
- Observabilidade: A capacidade de entender o que está acontecendo dentro de um sistema olhando para os dados de saída. Uma solução de observabilidade ajuda você a analisar esses dados para avaliar a integridade do sistema e encontrar maneiras de corrigir problemas em sua infraestrutura de TI.
A observabilidade primeiro leva o consumidor de monitoramento a entender o que é considerado o funcionamento normal de um serviço. Em outras palavras, você busca visibilidade total o mais rápido possível.
Depois de alcançar a observabilidade inicial, você aproveita esse nível inicial de visibilidade para desenvolver alertas acionáveis, criar painéis úteis e avaliar soluções AIOps. Essas informações permitem que você se sinta confortável com a métrica subjacente e os dados de monitoramento de log.
Nota
Isso é o oposto da abordagem usada no passado, quando as equipes trabalhavam para definir todos os requisitos de monitoramento primeiro no papel antes de criar, testar e implantar.
Quer o seu plano de monitorização tenha como alvo uma aplicação, a infraestrutura na nuvem ou a Plataforma Azure, o primeiro passo é estabelecer a observabilidade.
Esta abordagem também simplifica os seus planos. Em todos os casos, visibilidade total significa alcançar e manter visibilidade suficiente em três dimensões ou aspetos:
- Monitorizar em profundidade: Recolher sinais significativos e relevantes.
- Monitore de ponta a ponta ou amplitude: desde a camada mais baixa da pilha até o aplicativo.
- Monitorar em todo o modelo de integridade: concentre-se em aspetos de integridade, como disponibilidade, desempenho, segurança e continuidade.
A observabilidade é mais do que apenas um foco para suas equipes de TI. Uma meta essencial é garantir que os usuários finais possam usar os sistemas e que seus Objetivos de Nível de Serviço (SLO) sejam atingidos.
Soluções de monitorização e observabilidade
O monitoramento de infraestrutura e aplicativos pode ser complicado. A transformação dos negócios aplica a tecnologia para alcançar e ajudar a moldar suas estratégias. A nuvem influenciou ainda mais a natureza complicada do monitoramento.
Isto é demonstrado das seguintes formas:
- Mudança na transformação digital: os esforços de transformação digital das empresas mudam para a hiperexploração da tecnologia em nuvem.
- Monitoramento interno: o monitoramento é incorporado aos recursos e grupos de recursos do Azure versus ferramentas separadas que você gerencia localmente.
- Monitoramento expansivo As arquiteturas nativas da nuvem, como o Azure Monitor, são semelhantes às ferramentas de gerenciamento de incidentes e eventos de segurança (SIEM). O Azure Monitor é expansivo, orientado por logs e ordens de grandeza mais flexível do que as ferramentas locais tradicionais.
Os arquitetos devem, como os operadores, entender quais informações de diagnóstico um componente de infraestrutura ou aplicativo emite.
A combinação de fluxos de log multivariados, dinâmicos, de séries temporais, com eventos, com estado e telemétricos em inteligência valiosa depende do seguinte:
- Conhecimento da equipe: O conhecimento e a experiência do desenvolvedor ou engenheiro de sistema que entende profundamente o alvo de monitoramento.
- Experiência de solução de problemas: suporte e experiência de solução de problemas no uso de dados para localizar ou localizar as causas do problema.
- Aprender com o histórico: analise incidentes anteriores para encontrar razões não tecnológicas que possam ser corrigidas automaticamente mais tarde.
- Documentação: Orientação em documentação, software, treinamento ou consultoria pelo fornecedor de software ou hardware.
A Microsoft e seus parceiros fornecem pacotes de gerenciamento para o System Center Operations Manager. Os pacotes de gestão são específicos da tecnologia; por exemplo, se você importar um pacote de gerenciamento SQL, o Operations Manager descobrirá e direcionará automaticamente os servidores que hospedam o SQL Server e começará a monitorá-los. Aqui, a observabilidade é mais ou menos predefinida. O Operations Manager foi projetado principalmente para infraestrutura local, que tende a ser fixada em componentes e padrões de projeto arquitetônico relativos aos serviços em nuvem.
Na nuvem, você tem uma enorme flexibilidade nos tipos de serviços para escolher. O monitoramento inclui como os serviços mudam ao longo do tempo e pode ser dinâmico, global e resiliente. Com o Azure Monitor, você pode aproveitar as pastas de trabalho existentes incluídas no Azure Monitor Insights, fornecendo funcionalidade semelhante a um pacote de gerenciamento no Operations Manager.
A arte de ser observador
A observabilidade depende do que e como algo está sendo monitorado.
No Azure, há várias fontes de dados de monitoramento, cada uma oferecendo uma perspetiva diferente de como algo se comporta. O Azure inclui várias ferramentas para ajudar a analisar os vários aspetos destes dados.
Observe a plataforma
No Azure, a Microsoft fornece a perspetiva do provedor de serviços por meio de diferentes logs de plataforma.
Os serviços no Azure podem mudar de maneiras diferentes e imprevisíveis ao longo do tempo. Referimo-nos a este comportamento como dinâmico. Os gestores de serviços em nuvem que observam o serviço ao longo do tempo também precisam levar em conta o seguinte:
- Realocação de recursos: os recursos podem migrar ou mover-se entre locais ou geografias.
- Alterações de recursos: os recursos são adicionados, excluídos ou modificados.
- Consumo: O consumo varia para diferentes serviços e implementações. Esteja atento para monitorar o custo, o consumo e os gastos projetados.
Aqui estão alguns exemplos de ferramentas que permitem a observabilidade da sua plataforma:
Origem do registo | Description |
---|---|
Estado de funcionamento do serviço | Incidentes de serviço e manutenção planejada relatados pela Microsoft. |
Azure Resource Health | Relatórios sobre a saúde atual e passada dos seus recursos. |
Registo de atividades do Azure Monitor | Relata eventos no nível de assinatura em todos os recursos implantados na assinatura. |
Azure Monitor Change Analysis | Relata alterações em seus aplicativos do Azure e reduz o tempo médio de reparo (MTTR). |
Registos de recursos do Azure | Anteriormente conhecidos como logs de diagnóstico, os logs de recursos relatam operações executadas em um recurso do Azure, no plano de dados. |
Logs de relatórios do Microsoft Entra (AzureAD) | Relatórios sobre o histórico da atividade de entrada e a trilha de auditoria de alterações no ID do Microsoft Entra para um determinado locatário. |
Assistente do Azure | Use o Azure Advisor para receber soluções recomendadas com base nas práticas recomendadas para otimizar suas implantações do Azure. |
Logs de transparência do Microsoft Cloud for Sovereignty | Relatórios sobre quando os recursos são acessados e qual engenheiro da Microsoft acessa o recurso. Os logs de transparência fornecem detalhes de acesso aos recursos do cliente. Os logs também notificam quando não houve acesso, o que é comum. |
A observabilidade evolui gradualmente, começando com um plano de monitoramento minimamente viável, e o esforço para integrar ferramentas e processos está em andamento. À medida que se sente confortável com os dados (métricas, logs e transações), você pode entender o comportamento e os sinais de sintomas ou problemas desses recursos ou aplicativos. Ao se familiarizar com os dados, você cria confiança ao trabalhar com o Azure Monitor e os dados.
Ganhar confiança a partir da observabilidade
Com a devida observabilidade, você ganha confiança e é capaz de perceber a causa e encontrar respostas que podem ajudar. Quanto mais você aprende sobre seus dados, mais evoluídos seus processos se tornam e suas equipes ganham insights.
Para definir o cenário, aqui estão algumas maneiras de ganhar confiança da observabilidade:
Aumentar a previsibilidade: uma melhor monitorização dos recursos e serviços ajuda a identificar os problemas de forma proativa, tornando-os previsíveis e gerenciáveis no futuro.
Deteção precoce de anomalias: A observabilidade permite a deteção atempada de anomalias ou desvios do comportamento esperado, reduzindo o impacto de potenciais problemas.
Identificação da causa raiz: dados detalhados de observabilidade ajudam a identificar as causas dos problemas, permitindo uma resolução mais rápida e prevenindo a recorrência.
Melhore a eficiência da solução de problemas: com a observabilidade, as equipes podem diagnosticar e solucionar problemas complexos rapidamente analisando dados relevantes e correlacionando eventos.
Melhorar a confiabilidade do sistema: Ao identificar gargalos, problemas de desempenho e possíveis pontos de falha, a observabilidade ajuda a otimizar o desempenho do sistema e melhorar a confiabilidade geral.
Melhorar a experiência do cliente: A observabilidade permite uma melhor compreensão de como o desempenho do sistema afeta os usuários finais, permitindo medidas proativas para aumentar a satisfação do cliente.
Facilite a colaboração: as plataformas de observabilidade fornecem visibilidade compartilhada e acesso a dados, promovendo a cooperação entre diferentes equipes, como desenvolvedores, operações e suporte.
Conformidade regulamentar: a observabilidade ajuda a atender aos requisitos regulamentares, fornecendo rastreabilidade, logs de auditoria e garantindo a aderência aos padrões de segurança e privacidade.
Tempo de resolução mais rápido: ao fornecer dados e insights avançados, a observabilidade acelera o tempo para diagnosticar e resolver problemas, minimizando o tempo de inatividade e as interrupções do serviço.
Gerenciamento proativo de capacidade: os dados de observabilidade ajudam a prever demandas de recursos, identificar lacunas de capacidade e ajustar proativamente os recursos para manter o desempenho ideal.
Mitigação de riscos: com a observabilidade, você pode identificar riscos potenciais precocemente, permitindo medidas proativas de mitigação e reduzindo a probabilidade de impactos graves.
Monitorização e aprendizagem contínuas: A observabilidade permite a monitorização e aprendizagem contínuas, ajudando as equipas a adaptarem-se a ambientes, requisitos e comportamento do utilizador em mudança.
Otimização de desempenho: Ao analisar dados de observabilidade, as equipes podem identificar e otimizar gargalos de desempenho, aumentando a eficiência do sistema.
Priorização de esforços: os insights de observabilidade permitem que as equipes priorizem tarefas e aloquem recursos com base na criticidade e no impacto dos problemas identificados.
Confiança no gerenciamento de mudanças: a observabilidade fornece visibilidade sobre o impacto das mudanças, garantindo que novas implantações ou atualizações não introduzam problemas imprevistos.
Melhor resposta a incidentes: Com a observabilidade, as equipes de resposta a incidentes podem coletar rapidamente informações relevantes, entender o contexto e iniciar ações apropriadas.
Plano de monitorização
Você cria um plano de monitoramento para descrever as metas e objetivos, requisitos e outros detalhes essenciais. Em seguida, trabalhe para solicitar um acordo entre todas as partes interessadas relevantes na organização.
Um plano de monitorização deve explicar como desenvolver e aplicar uma ou mais soluções de monitorização. Comece a criar seus planos de monitoramento cedo durante as fases de estratégia e planejamento do projeto.
Ao criar o plano, é essencial lembrar as cinco disciplinas do monitoramento moderno, conforme descrito na documentação da estratégia de monitoramento em nuvem: monitorar, medir, responder, aprender e melhorar.
A seguir fornece uma estrutura de tópicos inicial recomendada para um plano de monitoramento e são consideradas as principais considerações para um plano individual de serviços ou ao padronizar recursos de serviço de nuvem, como tipos de recursos do Azure ou serviços do Microsoft 365.
A essência do plano é definir a linha de visibilidade entre os prestadores de serviços (que colocarão as soluções em campo) e os consumidores (que irão operar ou obter valor).
Perspetiva de negócio
Um plano de monitoramento abrangente deve considerar o que a empresa precisa com e a partir do monitoramento, incluindo um foco centrado no usuário. Ao definir o plano, é essencial documentar e compartilhar os requisitos de negócios, e o seguinte sugere o escopo dessa parte do plano.
- Partes interessadas e consumidores
- Fluxos de valor e processos de negócios
- Perspetiva e utilidade do utilizador final
- Requisitos de medição e comunicação de informações
- Riscos identificados e quadros de controlo de conformidade
- Requisitos de acesso e controlo
- Risco para o negócio
Perspetiva do serviço
Um plano de monitoramento abrangente deve considerar o que os proprietários de serviços precisam com e a partir do monitoramento. Ao definir o plano, é essencial documentar e compartilhar seus requisitos, e o seguinte sugere o escopo desta parte do plano.
- Partes interessadas e consumidores
- Funções e responsabilização
- Definição do serviço
- Requisitos de acesso e controlo
- Considerações arquitetônicas?
- Contratos de sustentação de fornecedores e parceiros
- Contratos de serviço (SLAs, OLAs)
- Identificar a cobertura da garantia de serviço
- Requisitos de medição e comunicação de informações
- Riscos
Perspetiva tecnológica
Esta seção do plano representa a solução de monitoramento usando informações da perspetiva de negócios e serviços. Sugere-se seguidamente o âmbito desta parte do plano.
- Histórias de usuários e cenários
- Objetivos técnicos (por exemplo, ligação em rede)
- Mapeamento de dependência de componentes
- Tipos (por exemplo, nativos da nuvem, híbridos, locais)
- Observacional
- Reativa
- Medida
- Ajuste e otimização
Considerações
Resuma o plano para garantir que ele comunique e informe todos os consumidores, partes interessadas e níveis de gestão relevantes. Para um plano de monitoramento bem-sucedido, considere estes pontos:
Considerações principais
Etapas de produção: A solução de monitoramento deve estar pronta quando o serviço entrar em operação. O planejamento pode incluir configuração de teste ou pré-produção em outra assinatura dedicada para ajudar a experimentar e testar suas suposições.
Estratégia: Os planos também podem ser mapeados para monitoramento e estratégia de TI para rastrear os objetivos de monitoramento para a missão ou negócio.
Metas: No plano, descreva e analise os ativos ou serviços alvo em consideração. Se necessário, mapeie todos os componentes a serem monitorados, incluindo dependências de serviço. Identifique lacunas de cobertura e determine quem é o proprietário de cada parte do serviço.
Solução: Para a solução de monitoramento, identifique os consumidores, partes interessadas, fornecedores, parceiros, acesso e instrumentação. Além disso, aspetos de monitoramento, escopo, resposta, relatórios e painéis (disponibilidade, segurança, experiência do usuário e muito mais).
Considerações gerais
Além das principais considerações, procure entender melhor como esses pontos podem influenciar o seu plano de monitoramento para a sua organização.
Produto mínimo viável (MVP): Deixe o plano definir como é o sucesso para o produto mínimo viável. Por outras palavras, o que é inicialmente necessário para entrar em funcionamento, e podemos medir o sucesso nisso? Depois de estar ativo, você continua a evoluir a solução de monitoramento para maximizar o valor.
Proteja seus dados de monitoramento: a segurança é um aspeto crucial para todas as organizações e equipes atualmente. Certifique-se de que você é educado e conhece os guarda-corpos, ou deixe que especialistas o guiem para que você não adicione risco às suas soluções de monitoramento, por exemplo, expondo dados confidenciais de monitoramento em logs.
Considere o Microsoft 365: qualquer bom plano considera seu locatário do Azure com o Microsoft 365 como um componente significativo. O Microsoft 365 depende do Microsoft Entra ID e o Azure Monitor fornece integração do Microsoft 365 com o gerenciamento de pontos finais.
A observabilidade vence: concentre-se na visibilidade total antes de se concentrar em alertar, pois alertar ambos é um custo e pode levar rapidamente à fadiga do alerta.
Monitoramento de atividades: auditoria, login e registros de atividades agora são fáceis para os proprietários de serviços e a segurança fatiar e dados. Certifique-se de que seu plano de monitoramento considere o monitoramento de atividades, incluindo os insights e painéis que você precisa criar para quaisquer partes interessadas relevantes.