Partilhar via


Solucionar problemas com a Instância Gerenciada SCOM do Azure Monitor

Este artigo descreve os erros que podem ocorrer quando você implanta ou usa a Instância Gerenciada SCOM do Azure Monitor e como resolvê-los.

Cenário: criação/implantação de instância gerenciada SCOM

Resolução de problemas gerais

  1. Certifique-se de que cumpre todos os pré-requisitos. Problemas de criação podem surgir devido a pré-requisitos impróprios/incompletos.
  2. Certifique-se de ler/verificar a mensagem de erro cuidadosamente. As mensagens de erro capturam o problema/erro na criação.
  3. Verifique o link Logs de instalação do SCOM fornecido na mensagem de erro. Selecione o link para baixar os logs de instalação do System Center Operations Manager. Analise os logs para identificar e resolver erros/falhas.
  4. Se você não conseguir identificar o problema com as etapas acima, entre na instância Conjuntos de Escala de Máquina Virtual e verifique os logs em C:\WindowsAzure\Logs\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows\1.0.66, o que ajuda a identificar o problema.
  5. Se o problema persistir, levante um ticket de suporte com todos os detalhes relevantes [correlation-id, subscription-id, e assim por diante]

Problema: o grupo %ResourceGroupName% de recursos é gerenciado por outro recurso do Azure

Causa: Ocorre quando a propriedade ManagedBy é definida para o grupo de recursos.

Resolução: forneça outro grupo de recursos com a propriedade ManagedBy como vazia.

Problema: a sub-rede %SubnetName% selecionada é dedicada a outro serviço

Causa: ocorre quando a sub-rede tem delegações.

Resolução: forneça uma sub-rede, que não é delegada a nenhum outro serviço.

Problema: Erro quando a Instância Gerenciada SCOM não consegue acessar a Instância Gerenciada SQL %instance%

Causa: Este erro pode ser causado por qualquer um dos seguintes motivos:

  • Falta visibilidade de linha de visão da VNet da instância gerenciada SCOM para o ponto de extremidade da instância gerenciada SQL.
  • Falta o nível certo de regras NSG para permitir o tráfego no ponto de extremidade público da Instância Gerenciada SQL.
  • MSI não é adicionado como administrador do Ative Directory.
  • A Instância Gerenciada SCOM pode não ter permissões de leitura na Instância Gerenciada SQL.
  • Pode haver um problema com sua rede virtual/região.

Resolução:

  • Forneça permissão de leitura para a Instância Gerenciada SQL.
  • O MSI deve ser adicionado como administrador do Ative Directory na Instância Gerenciada SQL.
  • Garanta a conectividade entre as redes de Instância Gerenciada SCOM e Instância Gerenciada SQL. Para obter mais informações, consulte Criar e configurar uma instância gerenciada do SQL.

Problema: não há núcleos suficientes para criar %instance% na região em determinada região

Causa: ocorre quando não há núcleos suficientes para criar uma instância em determinada região.

Resolução: verifique a seção de cota no portal do Azure e aloque mais núcleos do tipo Standard Ds3v2 na região, se necessário.

Problema: a chave secreta com o mesmo nome já está presente no cofre da chave

Causa: ocorre quando outra chave secreta com o mesmo nome já está presente no cofre da chave.

Resolução: altere o nome da instância.

Problema: a VM relatou uma falha ao processar a extensão joindomain para ingressar no domínio %DomainName%

Causa: Ocorre devido aos seguintes motivos:

  1. Visibilidade de linha de visão do SCOM Managed Instance Server para o controlador de domínio.
  2. As Credenciais de Usuário do Domínio não são fornecidas ou estão incorretas.
  3. O caminho da UO para o domínio do AD não é fornecido.

Resolução: verifique a causa e, consequentemente, tente resolver o problema.

Problema: IP estático já em uso

Causa: Ocorre se o IP estático estiver sendo usado por outra instância.

Resolução: use outro IP estático.

Problema: tipo de identidade inválido %identityType%

Causa: Ocorre devido à identidade gerenciada incorreta.

Resolução: forneça um dos tipos de identidade possíveis ((Nenhum), (SystemAssigned,UserAssigned)) e tente novamente.

Problema: o endereço %LbIpAddr% IP estático privado não pertence ao intervalo de sub-rede %subnet%

Causa: ocorre quando o endereço IP não está no intervalo de sub-rede.

Resolução: forneça um IP disponível a partir do intervalo de sub-redes e tente novamente a operação.

Cenário: Implantar relatórios no Power BI

Problema: a instância gerenciada do SQL não está acessível

Causa: ocorre se o ponto de extremidade público não estiver habilitado. O Power BI não poderá acessar a Instância Gerenciada do SQL.

Resolução: verifique as permissões do usuário na Instância Gerenciada SQL e forneça as permissões necessárias.

Problema: não é possível atualizar as credenciais do conjunto de dados

Causa: ocorre se o usuário não tiver as permissões apropriadas na Instância Gerenciada SQL.

Resolução: verifique as permissões do usuário na Instância Gerenciada SQL e forneça as permissões necessárias.

Problema: o relatório não consegue atualizar

Causa: Ocorre devido ao grande tamanho dos dados. O relatório pode não ser atualizado.

Resolução: se o espaço de trabalho do Power BI estiver na camada profissional , altere-o para a camada premium ou altere a capacidade do espaço de trabalho.

Cenário: Escala/redução manual

Problema: falha no teste de conectividade com a Internet. Os pontos de extremidade necessários não podem ser acessados a partir da VNet

Causa: problema de rede.

Resolução: verifique se a Instância Gerenciada SCOM tem acesso de saída à Internet e se o NSG/Firewall está configurado corretamente para permitir o acesso aos endpoints necessários, conforme descrito nos requisitos de firewall.

Problema: Quota excedida

Causa: ocorre se não houver núcleos disponíveis para dimensionamento.

Resolução: aumente o número de núcleos na assinatura.

Verifique a seção de cota no portal do Azure e aloque mais núcleos do tipo Standard Ds3v2 na região, se necessário.

Problema: erro de provisionamento de extensão

Causa: este erro pode ocorrer durante o provisionamento da extensão do System Center Operations Manager ou da instalação do System Center Operations Manager.

Resolução: verifique a solução de problemas geral, tente identificar o problema e resolva-o de acordo.

Questão: Conflito

Causa: ocorre se a aplicação de patches ou dimensionamento estiver em andamento. Uma nova operação não pode ser acionada.

Resolução: aguarde a conclusão do processo em curso e tente novamente.

Cenário: Aplicação de patches

Problema: falha no teste de conectividade com a Internet. Os pontos de extremidade necessários não podem ser acessados a partir da VNet

Causa: problema de rede.

Resolução: verifique se a Instância Gerenciada SCOM tem acesso de saída à Internet e se o NSG/Firewall está configurado corretamente para permitir o acesso aos endpoints necessários, conforme descrito nos requisitos de firewall.

Problema: a notificação está bloqueada ao buscar atualizações mesmo que a operação de atualização esteja concluída

Causa: problema de rede/problema de desenvolvimento.

Resolução: tente atualizar para obter atualizações. Se não for resolvido, contacte o suporte da Microsoft.

Problema: o estado da atualização não está refletido corretamente no cartão

Causa: problema de rede/problema de desenvolvimento.

Resolução: tente atualizar para obter atualizações. Se não for resolvido, contacte o suporte da Microsoft.

Problema: Inconsistência nos controles dentro do cartão

Causa: problema de consistência. Por exemplo, o botão de atualização está ativado mesmo que o título do cartão leia SCOM está atualizado.

Resolução: tente atualizar. Se não for resolvido, contacte o suporte da Microsoft.

Problema: a mensagem de aviso aparece para atualizações

Causa: Ocorre devido a qualquer um dos seguintes motivos:

  1. Nova atualização está disponível e o usuário não acionou a instância de atualização; quer
  2. Última atualização falhou e o usuário não acionou outra instância de atualização.

Resolução: acione uma instância de atualização.

Problema: a atualização falha após várias tentativas

Resolução: para resolver, entre em contato com o suporte da Microsoft.

Problema: a atualização falha e a reversão não deixa um estado inconsistente em que o número de VMs na instância de Conjuntos de Escala de Máquina Virtual foi modificado

Resolução: vá para o console do System Center Operations Manager e remova nós inconsistentes.

Problema: a atualização falha, mas a atualização do banco de dados é bem-sucedida

Causa: Ocorre devido a uma falha na atualização após a atualização bem-sucedida do banco de dados.

Resolução: tente novamente depois de algum tempo.

Problema: após a atualização bem-sucedida, o console do System Center Operations Manager não está funcionando corretamente na instância

Causa: ocorre se o System Center Operations Manager não estiver instalado corretamente ou se algum processo estiver preso.

Resolução: tente reiniciar a instância. Se o problema persistir, contacte o suporte da Microsoft.

Problema: a atualização está demorando mais de 3 horas e falha eventualmente

Causa: ocorre quando a atualização leva mais de 3 horas.

Resolução: entre em contato com o suporte da Microsoft.

Problema: algum problema intermitente durante a atualização

Causa: ocorre se a malha de serviço ou o RP falhar ou for reiniciado.

Resolução: reinicie a atualização.

Problema: o dimensionamento e a aplicação de patches são acionados simultaneamente e, em seguida, falham

Causa: ocorre se solicitações de dimensionamento e aplicação de patches forem enviadas e aceitas ao mesmo tempo.

Resolução: caso você tenha acionado uma operação de dimensionamento, aguarde a conclusão da operação antes de tentar atualizar a operação.

Problema: a extensão leva mais tempo para ser atualizada e falha

Causa: Ocorre se a Instância Gerenciada SQL e a Instância Gerenciada SCOM estiverem em regiões diferentes, devido às quais a extensão leva mais tempo para ser atualizada e, eventualmente, falha.

Resolução: tenha a Instância Gerenciada SQL e a Instância Gerenciada SCOM na mesma região.

Problema: após a aplicação de patches, os dados do usuário no banco de dados são alterados ou não são retidos corretamente

Causa: ocorre se a atualização não tiver sido feita corretamente.

Resolução: reinicie a atualização.

Problema: o pedido de aplicação de patches falha

Causa: Ocorre devido a um problema de portal ou ARM.

Resolução: aguarde algum tempo e tente novamente. Se o problema existir mesmo depois de corrigir o problema do portal/ARM, contacte o suporte da Microsoft.

Problema: a operação de aplicação de patches ou dimensionamento já está em andamento, tente novamente depois de algum tempo.

Causa: ocorre se uma operação de aplicação de patches ou dimensionamento já estiver em andamento.

Resolução: aguarde a conclusão da operação existente e tente depois de algum tempo.

Problema: Servidores de gerenciamento obsoletos visíveis no console

Causa: ocorre se uma operação de aplicação de patches ou dimensionamento tiver deixado um estado inconsistente após a conclusão.

Resolução: os Conjuntos de Escala de Máquina Virtual do Microsoft Azure são usados para provisionar os servidores de gerenciamento para Instâncias Gerenciadas SCOM. Para remover o servidor de gerenciamento obsoleto do sistema, execute estas etapas:

  1. Aceda aos Conjuntos de Escala de Máquina Virtual do Azure e inicie sessão num dos servidores de gestão da Instância Gerida SCOM.

  2. Inicie o PowerShell no modo administrativo e navegue até o seguinte diretório.

    C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows\<version>\bin\troubleshooter

    Nota

    Para encontrar a versão, vá para C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows e revise todas as versões disponíveis e, em seguida, selecione a mais recente.

  3. Execute o seguinte script:

    .\RemoveStaleManagementServers.ps1 
    

    O script é interativo e solicita o FQDN do servidor obsoleto.

  4. Forneça o FQDN preciso do servidor de gerenciamento obsoleto que você deseja remover.

    Por exemplo, FQDN: SCOMMI2000001.contoso.com.