Solucionar problemas com o SCOM do Azure Monitor Instância Gerenciada

Este artigo descreve os erros que podem ocorrer ao implantar ou usar o SCOM do Azure Monitor Instância Gerenciada e como resolve-los.

Cenário: SCOM Instância Gerenciada criação/implantação

Solução de problemas gerais

  1. Verifique se todos os pré-requisitos foram atendidos. Problemas de criação podem surgir devido a pré-requisitos inadequados/incompletos.
  2. Certifique-se de ler/marcar a mensagem de erro cuidadosamente. As mensagens de erro capturam o problema/erro na criação.
  3. Verifique o link Logs de instalação do SCOM fornecido na mensagem de erro. Selecione o link para baixar os logs de instalação do System Center Operations Manager. Analise os logs para identificar e resolve erros/falhas.
  4. Se você não conseguir identificar o problema com as etapas acima, entre na instância do Conjuntos de Dimensionamento de Máquinas Virtuais e marcar os logs em C:\WindowsAzure\Logs\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows\1.0.66, o que ajuda a identificar o problema.
  5. Se o problema persistir, gere um tíquete de suporte com todos os detalhes relevantes [correlation-id, subscription-ide assim por diante]

Problema: o grupo de recursos %ResourceGroupName% é gerenciado por outro recurso do Azure

Causa: ocorre quando a propriedade ManagedBy é definida para o grupo de recursos.

Resolução: forneça outro grupo de recursos com a propriedade ManagedBy como vazia.

Problema: a sub-rede %SubnetName% selecionada é dedicada a outro serviço

Causa: ocorre quando a sub-rede tem delegações.

Resolução: forneça uma sub-rede, que não é delegada a nenhum outro serviço.

Problema: erro quando o Instância Gerenciada do SCOM não consegue acessar Instância Gerenciada de SQL %instance%

Causa: esse erro pode ser causado por qualquer um dos seguintes motivos:

  • Visibilidade de linha de visão ausente do SCOM Instância Gerenciada VNet para Instância Gerenciada de SQL ponto de extremidade.
  • Falta o nível certo de regras NSG para permitir o tráfego em Instância Gerenciada de SQL ponto de extremidade público.
  • A MSI não é adicionada como administrador do Active Directory.
  • O Instância Gerenciada SCOM pode não ter permissões de leitura no Instância Gerenciada de SQL.
  • Pode haver um problema com sua VNet/Região.

Resolução:

  • Forneça permissão de leitura para o Instância Gerenciada de SQL.
  • A MSI deve ser adicionada como administrador do Active Directory no Instância Gerenciada de SQL.
  • Verifique a conectividade entre redes SCOM Instância Gerenciada e Instância Gerenciada de SQL. Para obter mais informações, consulte Criar e configurar um Instância Gerenciada de SQL.

Problema: não há núcleos suficientes para criar %instance% na região especificada

Causa: ocorre quando não há núcleos suficientes para criar uma instância na região especificada.

Resolução: verifique a seção de cota no portal do Azure e aloque mais núcleos do tipo Standard Ds3v2 na região, se necessário.

Problema: a chave secreta com o mesmo nome já está presente no cofre de chaves

Causa: ocorre quando outra chave secreta com o mesmo nome já está presente no cofre de chaves.

Resolução: altere o nome da instância.

Problema: a VM relatou uma falha ao processar a extensão joindomain para ingressar no domínio %DomainName%

Causa: ocorre devido aos seguintes motivos:

  1. Visibilidade de linha de visão do SCOM Instância Gerenciada Server para o Controlador de Domínio.
  2. As Credenciais do Usuário de Domínio não são fornecidas ou incorretas.
  3. O Caminho da UO para o Domínio do AD não é fornecido.

Resolução: verifique a causa e tente resolve o problema.

Problema: IP estático já em uso

Causa: ocorre se o IP estático está sendo usado por outra instância.

Resolução: use outro IP estático.

Problema: tipo de identidade inválido %identityType%

Causa: ocorre devido à identidade gerenciada incorreta.

Resolução: forneça um dos possíveis tipos de identidade ((Nenhum), (SystemAssigned,UserAssigned)) e tente novamente.

Problema: o endereço %LbIpAddr% IP estático privado não pertence ao intervalo de sub-rede %subnet%

Causa: ocorre porque o endereço IP não está no intervalo de sub-rede.

Resolução: forneça um IP disponível do intervalo de sub-rede e repita a operação.

Cenário: implantar relatórios no Power BI

Problema: Instância Gerenciada de SQL não é acessível

Causa: ocorre se o ponto de extremidade público não estiver habilitado. O Power BI não poderá acessar Instância Gerenciada de SQL.

Resolução: verifique as permissões de usuário no Instância Gerenciada de SQL e forneça as permissões necessárias.

Problema: não é possível atualizar as credenciais do conjunto de dados

Causa: ocorre se o usuário não tiver permissões apropriadas no Instância Gerenciada de SQL.

Resolução: verifique as permissões de usuário no Instância Gerenciada de SQL e forneça as permissões necessárias.

Problema: o relatório não pode ser atualizado

Causa: ocorre devido ao grande tamanho dos dados. O relatório pode não ser atualizado.

Resolução: se o workspace do Power BI estiver na camada pro , altere-o para a camada Premium ou altere a capacidade do workspace.

Cenário: Escala/redução manual

Problema: falha no teste de conectividade com a Internet. Os pontos de extremidade necessários não podem ser acessados pela VNet

Causa: problema de rede.

Resolução: verifique se o SCOM Instância Gerenciada tem acesso à Internet de saída e o NSG/Firewall está configurado corretamente para permitir o acesso aos pontos de extremidade necessários, conforme descrito nos requisitos de firewall.

Problema: Cota Excedida

Causa: ocorre se não houver núcleos disponíveis para dimensionamento.

Resolução: aumente o número de núcleos na assinatura.

Verifique a seção cota em portal do Azure e aloque mais núcleos do tipo Standard Ds3v2 na região, se necessário.

Problema: erro de provisionamento de extensão

Causa: esse erro pode ocorrer durante o provisionamento da extensão do System Center Operations Manager ou da instalação do System Center Operations Manager.

Resolução: verifique a solução de problemas geral, tente identificar o problema e resolve-o adequadamente.

Problema: Conflito

Causa: ocorre se a aplicação de patch ou o dimensionamento estiver em andamento. Uma nova operação não pode ser disparada.

Resolução: aguarde a conclusão do processo em andamento e tente novamente.

Cenário: aplicação de patch

Problema: falha no teste de conectividade com a Internet. Os pontos de extremidade necessários não podem ser acessados pela VNet

Causa: problema de rede.

Resolução: verifique se o SCOM Instância Gerenciada tem acesso à Internet de saída e o NSG/Firewall está configurado corretamente para permitir o acesso aos pontos de extremidade necessários, conforme descrito nos requisitos de firewall.

Problema: a notificação está paralisada em Buscar atualizações , mesmo que a operação de atualização esteja concluída

Causa: problema de desenvolvimento/problema de rede.

Resolução: tente atualizar para atualizações. Se não for resolvido, entre em contato com o suporte da Microsoft.

Problema: o estado de atualização não é refletido corretamente no cartão

Causa: problema de desenvolvimento/problema de rede.

Resolução: tente atualizar para atualizações. Se não for resolvido, entre em contato com o suporte da Microsoft.

Problema: inconsistência nos controles dentro do cartão

Causa: problema de consistência. Por exemplo, o botão atualizar está habilitado mesmo que o título do cartão lê SCOM esteja atualizado.

Resolução: tente atualizar. Se não for resolvido, entre em contato com o suporte da Microsoft.

Problema: a mensagem de aviso aparece para atualizações

Causa: ocorre devido a qualquer um dos seguintes motivos:

  1. A nova atualização está disponível e o usuário não disparou a instância de atualização; Ou
  2. Falha na última atualização e o usuário não disparou outra instância de atualização.

Resolução: dispare uma instância de atualização.

Problema: a atualização falha após várias tentativas

Resolução: para resolve, entre em contato com o suporte da Microsoft.

Problema: a atualização falha e a reversão não deixa um estado inconsistente em que o número de VMs na instância Conjuntos de Dimensionamento de Máquinas Virtuais foi modificado

Resolução: acesse o console do System Center Operations Manager e remova nós inconsistentes.

Problema: a atualização falha, mas a atualização do banco de dados é bem-sucedida

Causa: ocorre devido à falha na atualização após a atualização bem-sucedida do banco de dados.

Resolução: tente novamente após algum tempo.

Problema: após a atualização bem-sucedida, o console do System Center Operations Manager não está funcionando corretamente na instância

Causa: ocorre se o System Center Operations Manager não está instalado corretamente ou algum processo pode estar travado.

Resolução: tente reiniciar a instância. Se o problema persistir, contate o Suporte da Microsoft.

Problema: a atualização está levando mais de 3 horas e falha eventualmente

Causa: ocorre quando a atualização leva mais de 3 horas.

Resolução: contate o suporte da Microsoft.

Problema: algum problema intermitente durante a atualização

Causa: ocorre se a malha de serviço ou o RP falha ou reinicia.

Resolução: reinicie a atualização.

Problema: o dimensionamento e a aplicação de patch disparados simultaneamente e, em seguida, falha

Causa: ocorre se as solicitações de dimensionamento e aplicação de patch forem enviadas e aceitas ao mesmo tempo.

Resolução: caso você tenha disparado uma operação de dimensionamento, aguarde a conclusão da operação antes de tentar atualizar a operação.

Problema: a extensão leva mais tempo para ser atualizada e falha

Causa: ocorre se Instância Gerenciada de SQL e Instância Gerenciada SCOM estiverem em regiões diferentes devido ao qual a extensão leva mais tempo para ser atualizada e, eventualmente, falha.

Resolução: tenha Instância Gerenciada de SQL e Instância Gerenciada SCOM na mesma região.

Problema: após a aplicação de patch, os dados do usuário no banco de dados são alterados ou não são mantidos corretamente

Causa: ocorre se a atualização não foi feita corretamente.

Resolução: reinicie a atualização.

Problema: falha na solicitação de aplicação de patch

Causa: ocorre devido a um problema no portal ou no ARM.

Resolução: aguarde algum tempo e tente novamente. Se o problema existir mesmo depois de corrigir o problema do portal/ARM, entre em contato com o suporte da Microsoft.

Problema: a aplicação de patch ou a operação de dimensionamento já está em andamento, tente novamente após algum tempo.

Causa: ocorre se uma operação de aplicação de patch ou dimensionamento já estiver em andamento.

Resolução: aguarde a conclusão da operação existente e tente depois de algum tempo.

Problema: Servidores de Gerenciamento Obsoletos visíveis no console

Causa: ocorre se uma operação de aplicação de patch ou dimensionamento deixou um estado inconsistente após a conclusão.

Resolução: o Microsoft Azure Conjuntos de Dimensionamento de Máquinas Virtuais é usado para provisionar os servidores de gerenciamento para Instâncias Gerenciadas do SCOM. Para remover o servidor de gerenciamento obsoleto do sistema, siga estas etapas:

  1. Acesse o Conjuntos de Dimensionamento de Máquinas Virtuais do Azure e faça logon em um dos servidores de gerenciamento do Instância Gerenciada do SCOM.

  2. Inicie o PowerShell no modo administrativo e navegue até o diretório a seguir.

    C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows\<version>\bin\troubleshooter

    Observação

    Para localizar a versão, acesse C:\Packages\Plugins\Microsoft.Azure.SCOMMIServer.ScomServerForWindows e examine todas as versões disponíveis e selecione a mais recente.

  3. Execute este script:

    .\RemoveStaleManagementServers.ps1 
    

    O script é interativo e solicita o FQDN do servidor obsoleto.

  4. Forneça o FQDN preciso do servidor de gerenciamento obsoleto que você deseja remover.

    Por exemplo, FQDN: SCOMMI2000001.contoso.com.