Compartilhar via


Solução de problemas de teste do servidor do sistema

Para solucionar problemas que ocorrem com os testes do System.Server do Windows HLK (Windows Hardware Lab Kit), siga as etapas descritas neste artigo.

Neste artigo:

Solução de problemas gerais do servidor do sistema

  1. Examine os seguintes tópicos para obter ajuda no teste de servidor:

  2. Para teste de driver e dispositivo de servidor, verifique se o sistema em teste (SUT) está configurado da seguinte maneira:

    • A versão correta do Windows está instalada.

    • A opção Server Core está instalada.

    • O SUT tem um mínimo de quatro núcleos\processadores lógicos.

    • O SUT tem um mínimo de 6 GB de RAM instalado.

    • Para testes de dispositivo de armazenamento, talvez você precise de duas instâncias de dispositivo que tenham unidades de armazenamento se o dispositivo de armazenamento for um dispositivo de inicialização.

  3. Se você receber um erro informando que o Windows HLK Studio não pôde adicionar destinos ao projeto, reelecione o destino, feche o Windows HLK Studio e reinicie o Windows HLK Studio. O erro significa que os dados não são atualizados.

  4. O processo do Sysparse executa diretamente as DLLs do gatherer. Um segundo processo, o ACME (Asset Configuration Manager Engine), observa as alterações de hardware e alerta o sistema se ocorrer uma ou mais alterações de hardware. O ACME aguarda até que ocorra um tempo limite ou que os relatórios de alteração de hardware frequentes sejam interrompidos antes de iniciar os coletores inscritos.

    Alguns testes causam alterações de hardware durante toda a execução do teste. Isso faz com que o Sysparse seja executado regularmente. O Sysparse pode consumir grandes quantidades de memória, o que é causado pelos coletores que estão executando e coletando dados. O Sysparse não deve interferir no teste porque, na maioria dos casos, os testes não verificam o desempenho.

  5. Verifique se o sistema no qual o Controlador HLK do Windows está instalado tem recursos de hardware adequados para atender às demandas de teste. Consulte Pré-requisitos do Windows HLK para obter uma descrição desses requisitos de hardware. À medida que o número de dispositivos e sistemas que estão sendo testados aumenta, talvez seja necessário adicionar mais processadores, memória ou armazenamento.

Solução de problemas de testes de servidor do sistema com falha

Se um teste falhar, siga estas etapas:

  1. Se a falha ocorrer em minutos após a inicialização do teste, isso geralmente significa que algo não foi configurado corretamente. Confirme novamente a configuração do ambiente de teste.

  2. Se o teste for executado, deverá haver um arquivo de log chamado Srvlog.xml no Controlador HLK do Windows. Siga estas etapas:

    1. No Windows HLK Studio, abra o Monitor de Trabalho.

    2. Navegue até o pool de computadores do teste agendado.

    3. No painel Status da Execução do Trabalho , selecione Carregar Estresse do Servidor – Iniciar Teste para Servidor.

    4. No painel Status de Execução da Tarefa , clique com o botão direito do mouse em RunJob -Launch Server Logo Kit e selecione Resultado do Trabalho Filho.

    5. Retorne ao painel Status de Execução do Trabalho e selecione Iniciar Kit de Logotipo do Servidor.

    6. No painel Status da Execução da Tarefa , clique com o botão direito do mouse em Iniciar tarefa LogGen e selecione Exibir Log de Tarefas. O log é analisado do log do Loadgen original e contém apenas erros e passagens.

    7. Para recuperar o log de texto original do Loadgen, repita as etapas de 1 a 5 e clique com o botão direito do mouse em Iniciar Kit de Logotipo do Servidor e selecione Procurar Logs de Trabalho. Isso abre o compartilhamento de log no Controlador HLK do Windows; o arquivo de log loadgen srv.log está no compartilhamento.

    8. Arraste e solte o arquivo srv.log no Bloco de Notas.

    9. No Bloco de Notas, role até a parte inferior do arquivo.

    10. De baixo para cima, pesquise a cadeia de caracteres "Error -". O texto na mesma linha descreverá a falha. Talvez seja necessário pesquisar várias vezes para encontrar a causa da falha. As informações no arquivo de log fornecem apenas um indicador de alto nível do que falhou.

O Loadgen solicita mais clientes

Se os clientes existentes não puderem gerar estresse suficiente em relação ao SUT, o Loadgen solicitará mais SCs (clientes de estresse). Esse recurso destina-se a acomodar servidores grandes e a possibilidade de alguns SCs falharem no meio de uma execução. Em geral, você deve começar com oito SCs. O nível de estresse deve se estabilizar nas primeiras três a quatro horas do teste. Se mais clientes forem necessários, você geralmente verá o pop-up no MC (controlador de master) nesse período. Você terá sessenta minutos para adicionar um novo cliente ou o teste será encerrado e falhará.

Observação

Não é possível adicionar mais computadores a um pool de computadores após o início de um envio. Se você iniciar o teste usando menos de oito clientes, verifique se você tem clientes adicionais no pool de computadores antes de começar a testar.

Se o Loadgen solicitar mais clientes após quatro horas de teste, isso provavelmente significará que algo falhou. Um ou mais dos clientes existentes desistiram, ocorreram problemas de conectividade de rede ou outro problema está impedindo o SUT de detectar a carga de utilização necessária de 40%. Isso pode ser um problema do driver NIC em combinação com a velocidade de rede ou a implementação do driver de contadores de monitor de desempenho dos quais o Loadgen MC depende.

Nesse caso, tente as seguintes etapas de solução de problemas:

  1. Para descartar uma falha transitória de hardware na NIC, use uma NIC diferente que seja o mesmo modelo e fabricante.

  2. Use uma NIC de modelo diferente do mesmo fabricante, mas que usa o mesmo driver.

  3. Use uma NIC e um driver de um driver de fabricante diferente.

  4. Se uma ou mais NICs estiverem instaladas diretamente no quadro do sistema, entre na configuração do sistema de hardware e desabilite a NIC nesse nível para que o Windows não a detecte; em seguida, use um dispositivo e um driver diferentes para o teste.

  5. Se várias NICs estiverem instaladas diretamente no painel do sistema e você não puder instalar um dispositivo adicional em um slot PCI Express, vá para a configuração do sistema de hardware e desabilite todas, exceto uma das NICs, para que o Windows não os detecte.

Observação

Cada NIC detectada deve ser estressada durante o teste. Isso requer que cada NIC tenha SCs em um segmento de rede física separado.

Comutadores que têm recursos avançados integrados a eles podem interferir no teste de várias maneiras. Por exemplo:

  • Uma opção pode ter a capacidade de reduzir a velocidade das portas no comutador se detectar pacotes descartados ou outros erros em uma porta. Se uma NIC de 10GigE no SUT se destina a receber o tráfego resultante da lentidão de todas as portas para 1 GigE, o teste loadgen não poderá alcançar o nível de utilização de largura de banda de rede de 40% necessário para passar no teste.

  • Um comutador pode rotear o tráfego ou segmentar a rede em resposta a regras e lógica internas ao comutador (como balanceamento de carga, redundância, QoS (qualidade de serviço), espelhamento, duplex versus. operação simplex, ponte adaptável ou inteligente, priorização de porta ou filtragem mac), que pode afetar o nível de utilização da largura de banda da rede em uma NIC.

Error=0x80004005

Se você receber o seguinte erro: Main::RunMain:: Verificação de teste, o Spsrv parou e não passou a porcentagem de aprovação necessária (100) (Error=0x80004005). Neste caso, execute as etapas a seguir:

  1. Feche o Windows HLK Studio.

  2. Altere o nome do computador SUT para 15 caracteres ou menos.

  3. Reinicialize o SUT.

  4. Abra o Windows HLK Studio e execute novamente o teste Estresse do Servidor LoadGen – Iniciar Teste para Servidor .

Testes de estresse do servidor

Ao executar testes de estresse do servidor, verifique se a infraestrutura de rede que conecta o SUT aos SCs e o MC pode executar no nível do adaptador de rede cartão (NIC) no SUT. Se um SUT tiver uma ou mais NICs 10GigE, os SCs e a infraestrutura de rede deverão atender a esse nível de desempenho.

Verifique se a infraestrutura de rede que conecta DHCP, DNS, Active Directory, Controlador HLK do Windows, Windows HLK Studio, SUT, SCs e MC está operando corretamente. Todos os sistemas devem se comunicar entre si usando um nome de host ou endereço IP. Isso pode ser confirmado usando um teste de ping simples.

Verifique se os servidores DHCP, DNS e Active Directory estão funcionando corretamente. Não deve haver registros DNS obsoletos. O servidor DHCP deve estar autorizado a operar na rede, a configuração deve estar correta, os escopos DHCP devem estar corretos, não deve haver várias homing incorretas e não deve haver erros no log de eventos do sistema DHCP. O controlador de domínio do Active Directory não deve relatar erros e o serviço de tempo deve ser sincronizado em todos os sistemas.

Usando VMs (máquinas virtuais) no ambiente de teste

Não há problemas conhecidos do DHCP, DNS, AD e outros sistemas em uma VM. Os problemas podem ocorrer fazendo com que os SCs sejam executados em uma VM. Esses problemas normalmente estão relacionados à geração de carga de largura de banda de rede. Para evitar problemas, verifique se a seguinte configuração está configurada:

  • Cada VM sc deve ter uma NIC física dedicada para colocar a carga na rede conectada à NIC SUT.

  • No mínimo, você deve ter NICs físicas que são afinidades com as VMs sc que são capazes de pelo menos duas vezes a largura de banda máxima da NIC SUT.

  • Verifique se os sistemas físicos usados para VMs SC não estão sobrecarregados por altos níveis de utilização da CPU e se há memória física adequada para todas as VMs.

Teste do System.Server