Resolver problemas de replicação para VMs VMware e servidores físicos

Este artigo descreve alguns problemas comuns e erros específicos que você pode encontrar ao replicar VMs VMware locais e servidores físicos para o Azure usando o Site Recovery.

Etapa 1: Monitorar a integridade do servidor de processo

O Site Recovery usa o servidor de processo para receber e otimizar dados replicados e enviá-los para o Azure.

Recomendamos que você monitore a integridade dos servidores de processo no portal para garantir que eles estejam conectados e funcionando corretamente e que a replicação esteja progredindo para as máquinas de origem associadas ao servidor de processo.

Etapa 2: solucionar problemas de conectividade e replicação

Problemas de conectividade entre o servidor de origem e o servidor de processo ou entre o servidor de processo e o Azure geralmente causam falhas de replicação inicial e contínua.

Para resolver esses problemas, solucione problemas de conectividade e replicação.

Etapa 3: Solucionar problemas de máquinas de origem que não estão disponíveis para replicação

Quando você tenta selecionar a máquina de origem para habilitar a replicação usando o Site Recovery, a máquina pode não estar disponível por um dos seguintes motivos:

  • Duas máquinas virtuais com a mesma instância UUID: se duas máquinas virtuais no vCenter tiverem o mesmo UUID de instância, a primeira máquina virtual descoberta pelo servidor de configuração será exibida no portal do Azure. Para resolver esse problema, certifique-se de que não há duas máquinas virtuais têm a mesma instância UUID. Esse cenário é comumente visto em instâncias em que uma VM de backup fica ativa e é conectada aos nossos registros de descoberta. Consulte Azure Site Recovery VMware-to-Azure: Como limpar entradas duplicadas ou obsoletas para resolver.
  • Credenciais de usuário do vCenter incorretas: certifique-se de adicionar as credenciais corretas do vCenter ao configurar o servidor de configuração usando o modelo OVF ou a configuração unificada. Para verificar as credenciais adicionadas durante a instalação, consulte Modificar credenciais para descoberta automática.
  • Privilégios insuficientes do vCenter: Se as permissões fornecidas para acessar o vCenter não tiverem as permissões necessárias, poderá ocorrer uma falha na descoberta de máquinas virtuais. Certifique-se de que as permissões descritas em Preparar uma conta para descoberta automática sejam adicionadas à conta de usuário do vCenter.
  • Servidores de gerenciamento do Azure Site Recovery: se a máquina virtual for usada como um servidor de gerenciamento em uma ou mais das seguintes funções - Servidor de configuração/servidor de processo de expansão/Servidor de destino mestre, você não poderá escolher a máquina virtual no portal. Os servidores de gerenciamento não podem ser replicados.
  • Já protegido/com failover por meio dos serviços do Azure Site Recovery: se a máquina virtual já estiver protegida ou com failover por meio da Recuperação de Site, a máquina virtual não estará disponível para seleção para proteção no portal. Verifique se a máquina virtual que você está procurando no portal ainda não está protegida por nenhum outro usuário ou sob uma assinatura diferente.
  • vCenter não conectado: verifique se o vCenter está em um estado conectado. Para verificar, vá para Recovery Services vault Site Recovery > Infrastructure > Configuration Servers > Clique no respetivo servidor > de configuração uma folha abre à sua direita com detalhes dos servidores associados. Verifique se o vCenter está conectado. Se estiver no estado "Não conectado", resolva o problema e atualize o servidor de configuração no portal. Depois disso, a máquina virtual não é listada no portal.
  • ESXi desligado: se o host ESXi no qual a máquina virtual reside estiver em um estado desligado, a máquina virtual não estará listada ou não poderá ser selecionada no portal do Azure. Ligue o host ESXi e atualize o servidor de configuração no portal. Depois disso, a máquina virtual é listada no portal.
  • Reinicialização pendente: se houver uma reinicialização pendente na máquina virtual, você não poderá selecionar a máquina no portal do Azure. Certifique-se de concluir as atividades de reinicialização pendentes e atualizar o servidor de configuração. Depois disso, a máquina virtual é listada no portal.
  • IP não encontrado ou Máquina não tem um endereço IP: se a máquina virtual não tiver um endereço IP válido associado a ela, você não poderá selecionar a máquina no portal do Azure. Certifique-se de atribuir um endereço IP válido à máquina virtual e atualize o servidor de configuração. Também pode ser causado se a máquina não tiver um endereço IP válido associado a uma de suas NICs. Atribua um endereço IP válido a todas as NICs ou remova a NIC que está faltando o IP. Depois disso, a máquina virtual é listada no portal.

Solucionar problemas de máquinas virtuais protegidas esmaecidas no portal

As máquinas virtuais replicadas em Recuperação de Site não estarão disponíveis no portal do Azure se houver entradas duplicadas no sistema. Saiba mais sobre como excluir entradas obsoletas e resolver o problema.

Outra razão pode ser que a máquina foi clonada. Quando as máquinas se movem entre um hipervisor e se o ID do BIOS for alterado, o agente de mobilidade bloqueia a replicação. A replicação de máquinas clonadas não é suportada pelo Site Recovery.

Nenhum ponto de recuperação consistente com falhas disponível para a VM nos últimos minutos 'XXX'

Segue-se uma lista de alguns dos problemas mais comuns:

Problemas iniciais de replicação [erro 78169]

Além de garantir que não haja problemas relacionados à conectividade, largura de banda ou sincronização de tempo, certifique-se de que:

  • Nenhum software antivírus está a bloquear o Azure Site Recovery. Saiba mais sobre as exclusões de pasta necessárias para o Azure Site Recovery.

Máquinas de origem com alta rotatividade [erro 78188]

Causas possíveis:

  • A taxa de alteração de dados (bytes de gravação/seg) nos discos listados da máquina virtual é maior do que os limites suportados pelo Azure Site Recovery para o tipo de conta de armazenamento de destino de replicação.
  • Há um aumento repentino na taxa de churn devido ao qual uma grande quantidade de dados está pendente de upload.

Para resolver o problema:

  • Certifique-se de que o tipo de conta de armazenamento de destino (Standard ou Premium) seja provisionado de acordo com o requisito de taxa de rotatividade na origem.

  • Se você já estiver replicando para um disco gerenciado Premium (tipo asrseeddisk), verifique se o tamanho do disco suporta a taxa de rotatividade observada de acordo com os limites de Recuperação de Site. Você pode aumentar o tamanho do asrseeddisk, se necessário. Siga estes passos:

    • Navegue até a folha Discos da máquina replicada afetada e copie o nome do disco da réplica
    • Navegue até este disco gerenciado de réplica
    • Você pode ver um banner na folha Visão geral informando que uma URL SAS foi gerada. Clique neste banner e cancele a exportação. Ignore este passo se não vir o banner.
    • Assim que a URL SAS for revogada, vá para a folha Configuração do Disco Gerenciado e aumente o tamanho para que o Azure Site Recovery ofereça suporte à taxa de rotatividade observada no disco de origem.
  • Se a rotatividade observada for temporária, aguarde algumas horas para que o carregamento de dados pendentes se recupere e crie pontos de recuperação.

  • Se o disco contiver dados não críticos, como logs temporários, dados de teste, etc., considere mover esses dados para outro lugar ou excluir completamente esse disco da replicação

  • Se o problema persistir, use o planejador de implantação do Site Recovery para ajudar a planejar a replicação.

Máquinas de origem sem pulsação [erro 78174]

Isso acontece quando o agente de Mobilidade do Azure Site Recovery na Máquina de Origem está se comunicando com o Servidor de Configuração (CS).

Para resolver o problema, use as seguintes etapas para verificar a conectividade de rede da VM de origem para o servidor de configuração:

  1. Verifique se a máquina de origem está em execução.

  2. Entre na máquina de origem usando uma conta que tenha privilégios de administrador.

  3. Verifique se os seguintes serviços estão em execução e, se não, reinicie os serviços:

    • Svagents (Agente InMage Scout VX)
    • Serviço de Aplicação InMage Scout
  4. Na máquina de origem, examine os logs no local para obter detalhes do erro:

    C:\Arquivos de Programas (x86)\Microsoft Azure Site Recovery\agent\svagents*.log

Servidor de processo sem pulsação [erro 806]

Caso não haja pulsação do Process Server, verifique se:

  1. A VM do Process Server está em execução

  2. Verifique os seguintes logs no Process Server para obter detalhes do erro:

    C:\ProgramData\ASR\home\svsystems\eventmanager*.log
    e
    C:\ProgramData\ASR\home\svsystems\monitor_protection*.log

Servidor de destino mestre sem pulsação [erro 78022]

Isso acontece quando o agente de Mobilidade do Azure Site Recovery no Destino Mestre não está se comunicando com o Servidor de Configuração.

Para resolver o problema, use as seguintes etapas para verificar o status do serviço:

  1. Verifique se a VM de destino mestre está em execução.
  2. Entre na VM de destino mestre usando uma conta que tenha privilégios de administrador.
    • Verifique se o serviço svagents está em execução. Se estiver em execução, reinicie o serviço

    • Verifique os logs no local para obter detalhes do erro:

      C:\Arquivos de Programas (x86)\Microsoft Azure Site Recovery\agent\svagents*.log

  3. Para registrar o destino mestre no servidor de configuração, navegue até a pasta %PROGRAMDATA%\ASR\Agent e execute o seguinte no prompt de comando:
    cmd
    cdpcli.exe --registermt
    
    net stop obengine
    
    net start obengine
    
    exit
    

A proteção não pôde ser ativada com êxito para a máquina virtual [erro 78253]

Este erro pode ocorrer se uma política de replicação não tiver sido associada ao servidor de configuração corretamente. Também pode ocorrer se a política associada ao servidor de configuração não for válida.

Para confirmar a causa desse erro, navegue até o cofre > de recuperação gerenciar a infraestrutura do Site Recovery e, em seguida, visualize as políticas de replicação para VMware e máquinas físicas para verificar o status das políticas configuradas.

Para resolver o problema, você pode associar a política ao servidor de configuração em uso ou criar uma nova política de replicação e associá-la. Se a política for inválida, você poderá desassociá-la e excluí-la.

ID do erro 78144 – Nenhum ponto de recuperação consistente com a aplicação disponível para a VM nos últimos “X” minutos

Foram feitos aprimoramentos nas versões 9.23 e 9.27 do agente de mobilidade para lidar com comportamentos de falha de instalação do VSS. Certifique-se de que você está nas versões mais recentes para obter a melhor orientação sobre como solucionar falhas de VSS.

Alguns dos problemas mais comuns estão listados:

Causa 1: Problema conhecido no SQL Server 2008/2008 R2

Como corrigir: Há um problema conhecido com o SQL Server 2008/2008 R2. Consulte este artigo da Base de Dados de Conhecimento Azure Site Recovery Agent ou outro backup VSS não componente falha para um servidor que hospeda o SQL Server 2008 R2

Causa 2: os trabalhos do Azure Site Recovery falham em servidores que hospedam qualquer versão de instâncias do SQL Server com AUTO_CLOSE DBs

Como corrigir: Consulte o artigo Kb

Como corrigir : Consulte o artigo da Base de Dados de Conhecimento

Causa 3: Problema conhecido no SQL Server 2016 e 2017

Como corrigir: Consulte o artigo Kb

Causa 4: Consistência de aplicativo não habilitada em servidores Linux

Como corrigir: O Azure Site Recovery for Linux Operation System dá suporte a scripts personalizados de aplicativos para consistência de aplicativos. O script personalizado com opções pré e pós será usado pelo Agente de Mobilidade do Azure Site Recovery para consistência de aplicativo. Aqui estão as etapas para habilitá-lo.

Para solucionar problemas adicionais, verifique os arquivos na máquina de origem para obter o código de erro exato para falha:

C:\Arquivos de Programas (x86)\Microsoft Azure Site Recovery\agent\Application Data\ApplicationPolicyLogs\vacp.log

Como localizar os erros no arquivo? Procure a string "vacpError" abrindo o arquivo vacp.log em um editor

Ex: vacpError:220#Following disks are in FilteringStopped state [\\.\PHYSICALDRIVE1=5, ]#220|^|224#FAILED: CheckWriterStatus().#2147754994|^|226#FAILED to revoke tags.FAILED: CheckWriterStatus().#2147754994|^|

No exemplo anterior, 2147754994 é o código de erro que informa sobre a falha, conforme mostrado:

O gravador VSS não está instalado - Erro 2147221164

Como corrigir: Para gerar uma marca de consistência de aplicativo, o Azure Site Recovery usa o VSS (Serviço de Cópias de Sombra de Volume) da Microsoft. Ele instala um provedor VSS para sua operação para tirar instantâneos de consistência do aplicativo. Este VSS Provider é instalado como um serviço. Caso o serviço VSS Provider não esteja instalado, a criação do instantâneo de consistência do aplicativo falhará com a ID de erro 0x80040154 "Classe não registrada".

Consulte o artigo para solucionar problemas de instalação do gravador VSS

O gravador VSS está desativado - Erro 2147943458

Como corrigir: Para gerar uma marca de consistência de aplicativo, o Azure Site Recovery usa o VSS (Serviço de Cópias de Sombra de Volume) da Microsoft. Ele instala um provedor VSS para sua operação para tirar instantâneos de consistência do aplicativo. Este VSS Provider é instalado como um serviço. Caso o serviço Provedor VSS esteja desabilitado, a criação do instantâneo de consistência do aplicativo falhará com a ID de erro "O serviço especificado está desabilitado e não pode ser iniciado(0x80070422)".

  • Se o VSS estiver desativado,
    • Verifique se o tipo de inicialização do serviço VSS Provider está definido como Automático.
    • Reinicie os seguintes serviços:
      • Serviço VSS
      • Fornecedor do VSS do Azure Site Recovery
      • Serviço VDS

VSS PROVIDER NOT_REGISTERED - Erro 2147754756

Como corrigir: Para gerar uma marca de consistência de aplicativo, o Azure Site Recovery usa o VSS (Serviço de Cópias de Sombra de Volume) da Microsoft. Verifique se o serviço Provedor VSS do Azure Site Recovery está instalado ou não.

  • Tente novamente a instalação do provedor usando os seguintes comandos:
  • Desinstale o provedor existente: C:\Arquivos de Programas (x86)\Microsoft Azure Site Recovery\agent\InMageVSSProvider_Uninstall.cmd
  • Reinstalar: C:\Arquivos de Programas (x86)\Microsoft Azure Site Recovery\agent\InMageVSSProvider_Install.cmd

Verifique se o tipo de inicialização do serviço VSS Provider está definido como Automático. - Reinicie os seguintes serviços: - Serviço VSS - Azure Site Recovery VSS Provider - Serviço VDS

ID de erro 95001 - Permissões insuficientes encontradas

Este erro ocorre ao tentar habilitar a replicação e as pastas do aplicativo não têm permissões suficientes.

Como corrigir: Para resolver esse problema, verifique se o usuário IUSR tem a função de proprietário para todas as seguintes pastas -

  • C:\ProgramData\Microsoft Azure Site Recovery\privado
  • O diretório de instalação. Por exemplo, se o diretório de instalação for uma unidade F, forneça as permissões corretas para:
    • F:\Arquivos de Programas (x86)\Microsoft Azure Site Recovery\home\svsystems
  • A pasta \pushinstallsvc no diretório de instalação. Por exemplo, se o diretório de instalação for uma unidade F, forneça as permissões corretas para -
    • F:\Arquivos de Programas (x86)\Microsoft Azure Site Recovery\home\svsystems\pushinstallsvc
  • A pasta \etc no diretório de instalação. Por exemplo, se o diretório de instalação for uma unidade F, forneça as permissões corretas para -
    • F:\Arquivos de Programas (x86)\Microsoft Azure Site Recovery\home\svsystems\etc
  • C:\Temp
  • C:\terceiros\php5nts
  • Todos os itens sob o seguinte caminho -
    • C:\terceiros\rrdtool-1.2.15-win32-perl58\rrdtool\Lançamento*

Solucionar problemas e lidar com alterações de tempo em servidores replicados

Este erro ocorre quando o tempo da máquina de origem avança e, em seguida, retrocede em um curto espaço de tempo, para corrigir a alteração. Você pode não notar a mudança, pois o tempo é corrigido rapidamente.

Como corrigir: Para resolver esse problema, aguarde até que o tempo do sistema cruze o tempo futuro enviesado. Outra opção é desabilitar e habilitar a replicação mais uma vez, o que só é viável para replicação direta (dados replicados do local para o Azure) e não é aplicável à replicação reversa (dados replicados do Azure para o local).

Próximos passos

Se precisar de mais ajuda, publique sua pergunta na página de perguntas e respostas da Microsoft para o Azure Site Recovery. Temos uma comunidade ativa e um dos nossos engenheiros pode ajudá-lo.