Execute diagnósticos, colete logs para solucionar problemas de dispositivo do Azure Stack Edge

APLICA-SE A:Yes for Pro GPU SKUAzure Stack Edge Pro - GPUYes for Pro 2 SKUAzure Stack Edge Pro 2Yes for Pro R SKUAzure Stack Edge Pro R Azure Stack Edge Mini RYes for Mini R SKU

Este artigo descreve como executar diagnósticos, coletar um pacote de suporte, reunir logs de segurança avançados e revisar logs para solucionar problemas de carregamento e atualização de dispositivos em seu dispositivo Azure Stack Edge.

Executar diagnósticos

Para diagnosticar e resolver quaisquer erros do dispositivo, pode executar os testes de diagnóstico. Efetue os seguintes passos na IU da Web local no dispositivo para executar testes de diagnóstico.

  1. Na interface do usuário da Web local, vá para Solução de problemas de testes de > diagnóstico. Selecione o teste que deseja executar e selecione Executar teste. Será notificado de que o dispositivo está a executar testes.

    Select tests

    Aqui está uma tabela que descreve cada um dos testes de diagnóstico que são executados no seu dispositivo Azure Stack Edge.

    Nome do Teste Descrição
    Conectividade do portal do Azure O teste valida a conectividade do seu dispositivo Azure Stack Edge com o portal do Azure.
    Serviços de saúde consistentes do Azure Vários serviços, como o Azure Resource Manager, o provedor de recursos de computação, o provedor de recursos de rede e o serviço de armazenamento de Blob, são executados em seu dispositivo. Esses serviços juntos fornecem uma pilha consistente do Azure. A verificação de integridade garante que esses serviços consistentes do Azure estejam ativos e em execução.
    Certificados O teste valida a data de expiração e o impacto da alteração do dispositivo e do domínio DNS nos certificados. A verificação de integridade verificou se todos os certificados são importados e aplicados em todos os nós do dispositivo.
    Tempo de execução do Azure Edge Compute O teste valida se o serviço Kubernetes do Azure Stack Edge está funcionando conforme o esperado. Isso inclui verificar a integridade da VM do Kubernetes, bem como o status dos serviços do Kubernetes implantados pelo seu dispositivo.
    Discos O teste valida se todos os discos do dispositivo estão conectados e funcionais. Isso inclui verificar se os discos têm o firmware correto instalado e se o Bitlocker está configurado corretamente.
    Unidades de fonte de alimentação (PSUs) O teste valida que todas as fontes de alimentação estão conectadas e funcionando.
    Interfaces de rede O teste valida se todas as interfaces de rede estão conectadas no dispositivo e se a topologia de rede para esse sistema está conforme o esperado.
    Unidades centrais de processamento (CPUs) O teste valida que as CPUs no sistema têm a configuração correta e que estão ativas e funcionais.
    Aceleração de computação O teste valida que a aceleração de computação está funcionando como esperado em termos de hardware e software. Dependendo do modelo do dispositivo, a aceleração de computação pode ser uma Unidade de Processamento Gráfico (GPU) ou uma Unidade de Processamento de Visão (VPU) ou um FPGA (Field Programmable Gate Array).
    Definições de rede Este teste valida a configuração de rede do dispositivo.
    Ligação à Internet Este teste valida a conectividade à Internet do dispositivo.
    Software de sistema Esse teste valida se o armazenamento do sistema e a pilha de software estão funcionando conforme o esperado.
    Sincronização da hora Este teste valida as configurações de tempo do dispositivo e verifica se o servidor de tempo configurado no dispositivo é válido e acessível.
    Prontidão para Atualização de Software Este teste valida se o servidor de atualizações configurado é válido e acessível.
  2. Depois de os testes estarem concluídos, os resultados são apresentados.

    View test results

    Se um teste falhar, é apresentado um URL para a ação recomendada. Selecione o URL para visualizar a ação recomendada.

    Review warnings for failed tests

Recolher pacote de Suporte

Um pacote de registos é composto por todos os registos relevantes que possam ajudar o Suporte da Microsoft a resolver quaisquer problemas do dispositivo. Pode gerar um pacote de registos através da IU da Web local.

Efetue os seguintes passos para recolher um pacote de Suporte.

  1. Na interface do usuário da Web local, vá para Suporte para solução de problemas>. Selecione Criar pacote de suporte. O sistema começa a recolher o pacote de suporte. A recolha do pacote pode demorar vários minutos.

    Select add user

  2. Depois que o pacote de suporte for criado, selecione Baixar pacote de suporte. Um pacote zipado é transferido no caminho que escolher. Pode deszipar o pacote e ver os ficheiros de registo do sistema.

    Select add user 2

Reúna logs de segurança avançados

Os logs de segurança avançados podem ser logs de intrusão de software ou hardware para seu dispositivo Azure Stack Edge Pro.

Registos de intrusão de software

A intrusão de software ou os logs de firewall padrão são coletados para o tráfego de entrada e saída.

  • Quando o dispositivo é fotografado de fábrica, o registo predefinido da firewall é ativado. Esses logs são agrupados no pacote de suporte por padrão quando você cria um pacote de suporte por meio da interface do usuário local ou da interface do Windows PowerShell do dispositivo.

  • Se apenas os logs de firewall forem necessários no pacote de suporte para revisar qualquer intrusão de software (NW) no dispositivo, use -Include FirewallLog a opção ao criar o pacote de suporte.

  • Se nenhuma opção de inclusão específica for fornecida, o log do firewall será incluído como padrão no pacote de suporte.

  • No pacote de suporte, o log do firewall é o pfirewall.log e fica na pasta raiz. Aqui está um exemplo do log de intrusão de software para o dispositivo Azure Stack Edge Pro.

    #Version: 1.5
    #Software: Microsoft Windows Firewall
    #Time Format: Local
    #Fields: date time action protocol src-ip dst-ip src-port dst-port size tcpflags tcpsyn tcpack tcpwin icmptype icmpcode info path
    
    2019-11-06 12:35:19 DROP UDP 5.5.3.197 224.0.0.251 5353 5353 59 - - - - - - - RECEIVE
    2019-11-06 12:35:19 DROP UDP fe80::3680:dff:fe01:9e88 ff02::fb 5353 5353 89 - - - - - - - RECEIVE
    2019-11-06 12:35:19 DROP UDP fe80::3680:dff:fe01:9e88 ff02::fb 5353 5353 89 - - - - - - - RECEIVE
    2019-11-06 12:35:19 DROP UDP fe80::3680:dff:fe01:9e88 ff02::fb 5353 5353 89 - - - - - - 
    2019-11-06 12:35:19 DROP UDP fe80::3680:dff:fe01:9d87 ff02::fb 5353 5353 79 - - - - - - - RECEIVE
    2019-11-06 12:35:19 DROP UDP 5.5.3.193 224.0.0.251 5353 5353 59 - - - - - - - RECEIVE
    2019-11-06 12:35:19 DROP UDP fe80::3680:dff:fe08:20d5 ff02::fb 5353 5353 89 - - - - - - - RECEIVE
    2019-11-06 12:35:19 DROP UDP fe80::3680:dff:fe08:20d5 ff02::fb 5353 5353 89 - - - - - - - RECEIVE
    2019-11-06 12:35:19 DROP UDP fe80::3680:dff:fe01:9e8b ff02::fb 5353 5353 89 - - - - - - - RECEIVE
    2019-11-06 12:35:19 DROP UDP fe80::3680:dff:fe01:9e8b ff02::fb 5353 5353 89 - - - - - - - RECEIVE
    2019-11-06 12:35:19 DROP UDP 5.5.3.33 224.0.0.251 5353 5353 59 - - - - - - - RECEIVE
    2019-11-06 12:35:19 DROP UDP fe80::3680:dff:fe01:9e8b ff02::fb 5353 5353 89 - - - - - - - RECEIVE
    2019-11-06 12:35:19 DROP UDP fe80::3680:dff:fe01:9e8a ff02::fb 5353 5353 89 - - - - - - - RECEIVE
    2019-11-06 12:35:19 DROP UDP fe80::3680:dff:fe01:9e8b ff02::fb 5353 5353 89 - - - - - - - RECEIVE
    

Logs de intrusão de hardware

Para detetar qualquer intrusão de hardware no dispositivo, atualmente todos os eventos do chassi, como abertura ou fechamento do chassi, são registrados.

  • O log de eventos do sistema do dispositivo é lido usando o racadm cmdlet. Esses eventos são então filtrados para eventos relacionados ao chassi em um HWIntrusion.txt arquivo.

  • Para obter apenas o log de intrusão de hardware no pacote de suporte, use a -Include HWSelLog opção ao criar o pacote de suporte.

  • Se nenhuma opção de inclusão específica for fornecida, o log de intrusão de hardware será incluído como padrão no pacote de suporte.

  • No pacote de suporte, o log de intrusão de hardware é o HWIntrusion.txt e fica na pasta raiz. Aqui está um exemplo do log de intrusão de hardware para o dispositivo Azure Stack Edge Pro.

    09/04/2019 15:51:23 system Critical The chassis is open while the power is off.
    09/04/2019 15:51:30 system Ok The chassis is closed while the power is off.
    

Solucionar problemas de erros de carregamento e atualização de dispositivos

Quaisquer erros ocorridos durante os processos de carregamento e atualização são incluídos nos ficheiros de erro correspondente.

  1. Para visualizar os ficheiros de erro, aceda à sua partilha e selecione a partilha para ver o conteúdo.

  2. Selecione a pasta Microsoft Data Box Edge. Esta pasta tem duas subpastas:

    • A pasta de carregamentos, que inclui os ficheiros de registos com erros de carregamento.
    • A pasta de atualizações para os erros durante a atualização.

    Eis um ficheiro de registo de exemplo para atualização.

    <root container="test1" machine="VM15BS020663" timestamp="03/18/2019 00:11:10" />
    <file item="test.txt" local="False" remote="True" error="16001" />
    <summary runtime="00:00:00.0945320" errors="1" creates="2" deletes="0" insync="3" replaces="0" pending="9" />
    
  3. Quando vir um erro neste ficheiro (realçado no exemplo), preste atenção ao código de erro, neste caso é 16001. Procure a descrição deste código de erro em relação à seguinte referência de erro.

    Código de erro Descrição do erro
    100 O nome do contentor ou da partilha tem de ter entre 3 e 63 carateres.
    101 O nome do contentor ou da partilha só pode ter letras, números ou hífenes.
    102 O nome do contentor ou da partilha só pode ter letras, números ou hífenes.
    103 O nome do blob ou ficheiro contém carateres de controlo não suportados.
    104 O nome do blob ou ficheiro contém carateres de controlo inválidos.
    105 O nome blob ou ficheiro contém demasiados segmentos (cada segmento é separado por uma barra -/).
    106 O nome do blob ou ficheiro é demasiado longo.
    107 Um dos segmentos no nome do blob ou ficheiro é demasiado longo.
    108 O tamanho do ficheiro excede o tamanho máximo de ficheiro para carregamento.
    109 O blob ou ficheiro está alinhado incorretamente.
    110 O nome do ficheiro ou blob codificado por Unicode não é válido.
    111 O nome ou o prefixo do ficheiro ou blob é um nome reservado que não é suportado (por exemplo, COM1).
    2000 Um erro de correspondência de etag indica que existe um conflito entre um blob de blocos na cloud e no dispositivo. Para resolver este conflito, elimine um desses ficheiros – a versão na cloud ou a versão no dispositivo.
    2001 Ocorreu um problema inesperado ao processar um ficheiro depois de o ficheiro ter sido carregado. Se vir este erro, e o erro persistir durante mais de 24 horas, contacte o suporte.
    2002 O ficheiro já está aberto noutro processo e não pode ser carregado até que o identificador seja fechado.
    2003 Não foi possível abrir o ficheiro para carregamento. Se vir este erro, contacte o Suporte da Microsoft.
    2004 Não foi possível ligar ao contentor para carregar dados para o mesmo.
    2005 Não foi possível ligar ao contentor porque as permissões de conta estão erradas ou desatualizadas. Verifique o seu acesso.
    2006 Não foi possível carregar dados para a conta porque a conta ou a partilha está desativada.
    2007 Não foi possível ligar ao contentor porque as permissões de conta estão erradas ou desatualizadas. Verifique o seu acesso.
    2008 Não foi possível adicionar novos dados porque o contentor está cheio. Verifique as especificações do Azure para tamanhos de contentor suportados com base no tipo. Por exemplo, o Azure Files só suporta um tamanho de ficheiro máximo de 5 TB.
    2009 Não foi possível carregar dados porque o contêiner associado ao compartilhamento não existe.
    2997 Ocorreu um erro inesperado. Este é um erro transitório que se resolverá sozinho.
    2998 Ocorreu um erro inesperado. O erro pode ser resolvido de forma automática mas se persistir durante mais de 24 horas, contacte o Suporte da Microsoft.
    16000 Não foi possível atualizar este ficheiro.
    16001 Não foi possível atualizar este ficheiro porque já existe no sistema local.
    16002 Não foi possível atualizar este ficheiro porque não está totalmente carregado.

Próximos passos