Monitorar clusters com o Serviço de Integridade

Aplica-se a: Azure Stack HCI, versões 23H2 e 22H2; Windows Server 2022, Windows Server 2019 Windows Server 2016

O Serviço de Integridade, lançado pela primeira vez em Windows Server 2016, melhora o monitoramento diário e a experiência operacional para clusters que executam Espaços de Armazenamento Diretos.

Pré-requisitos

O Serviço de Integridade é habilitado por padrão com Espaços de Armazenamento Direto. Nenhuma ação adicional é necessária para configurá-lo ou iniciá-lo. Para saber mais sobre Espaços de Armazenamento Diretos, confira a visão geral do Espaços de Armazenamento Diretos.

Histórico de desempenho do cluster

Obtenha informações de desempenho e capacidade ao vivo do cluster Espaços de Armazenamento Diretos. Confira Obter histórico de desempenho do cluster.

Falhas do Serviço de Integridade

Exiba as falhas atuais para verificar facilmente a integridade da implantação. Confira Exibir falhas do Serviço de Integridade.

Ações do Serviço de Integridade

Acompanhe o progresso das ações do Serviço de Integridade executadas de forma autônoma. Confira Acompanhar ações do Serviço de Integridade.

Automação

Esta seção descreve os fluxos de trabalho que são automatizados pelo Serviço de Integridade no ciclo de vida do disco.

Ciclo de vida do disco

O Serviço de Integridade automatiza a maioria dos estágios do ciclo de vida do disco físico. Digamos que o estado inicial de sua implantação esteja com integridade perfeita, ou seja, todos os discos físicos estão funcionando corretamente.

Desativação

Os discos físicos são desativados automaticamente quando não podem ser usados e uma falha correspondente é gerada. Há vários casos:

  • Falha de mídia: o disco físico está definitivamente com falha ou danificado e deve ser substituído.
  • Perda de comunicação: o disco físico perdeu a conectividade por mais de 15 minutos consecutivos.
  • Sem resposta: o disco físico apresentou latência de mais de 5,0 segundos três ou mais vezes em uma hora.

Observação

Se a conectividade for perdida em muitos discos físicos ao mesmo tempo ou para um nó ou compartimento de armazenamento inteiro, o Serviço de Integridade não desativará esses discos, pois eles podem não ser a causa-raiz do problema.

Se o disco desativado atuava como o cache de muitos outros discos físicos, eles serão automaticamente reatribuídos para outro disco de cache, caso disponível. Nenhuma ação especial do usuário é necessária.

Restauração de resiliência

Depois que um disco físico é desativado, o Serviço de Integridade começa imediatamente a copiar seus dados para os discos físicos restantes, para restaurar a capacidade de recuperação completa. Quando isso é concluído, os dados estão completamente seguros e tolerantes a falhas novamente.

Observação

Essa restauração imediata requer capacidade disponível suficiente entre os discos físicos restantes.

Piscar a luz indicadora

Se possível, o Serviço de Integridade começará a piscar a luz indicadora no disco físico obsoleto ou em seu slot. Isso continuará indefinidamente, até que o disco obsoleto seja substituído.

Observação

Em alguns casos, o disco pode ter falhado de uma maneira que impeça até mesmo que seu indicador luminoso funcione (por exemplo, uma perda total de energia).

Substituição física

Você deve substituir o disco físico obsoleto quando possível. Na maioria das vezes, isso consiste em uma troca dinâmica, ou seja, não é necessário desligar o nó ou o compartimento de armazenamento. Veja Falha para obter informações úteis sobre locais e peças.

Verificação

Quando o disco de substituição for inserido, ele será verificado em relação ao Documento de Componentes Com Suporte (consulte a próxima seção).

Agrupamento

Se permitido, o disco de substituição é substituído automaticamente no pool do predecessor para que o uso seja iniciado. Nesse ponto, o sistema retorna ao estado inicial de integridade perfeita e, em seguida, a falha desaparece.

Documento componentes com suporte

O Serviço de Integridade fornece um mecanismo de imposição para restringir os componentes usados pelo Espaços de Armazenamento Diretos àqueles em um documento de componentes com suporte fornecido pelo administrador ou fornecedor da solução. Isso pode ser usado para impedir o uso incorreto de hardware sem suporte por você ou outros usuários, o que pode ajudar na conformidade de contrato de suporte ou garantia. Atualmente, essa funcionalidade está limitada a dispositivos de disco físico, incluindo SSDs, HDDs e unidades NVMe. O Documento de Componentes Com Suporte pode restringir o modelo, o fabricante (opcional) e a versão do firmware (opcional).

Uso

O Documento de Componentes Com Suporte usa uma sintaxe inspirada em XML. É recomendável usar seu editor de texto favorito, como o Visual Studio Code gratuito ou o Bloco de Notas, para criar um documento XML que você possa salvar e reutilizar.

Seções

O documento tem duas seções independentes: Disks e Cache.

Se a Disks seção for fornecida, somente as unidades listadas (como Disk) poderão ingressar em pools. Todas as unidades não listadas são impedidas de ingressar em pools, o que efetivamente impede seu uso na produção. Se esta seção for deixada vazia, qualquer unidade terá permissão para ingressar em pools.

Se a Cache seção for fornecida, somente as unidades listadas (como CacheDisk) serão usadas para cache. Se esta seção for deixada vazia, Espaços de Armazenamento Diretos tentará adivinhar com base no tipo de mídia e no tipo de barramento. As unidades listadas aqui também devem ser listadas em Disks.

Importante

O Documento de Componentes Com Suporte não se aplica retroativamente a unidades já em pool e em uso.

Exemplo

<Components>

  <Disks>
    <Disk>
      <Manufacturer>Contoso</Manufacturer>
      <Model>XYZ9000</Model>
      <AllowedFirmware>
        <Version>2.0</Version>
        <Version>2.1</Version>
        <Version>2.2</Version>
      </AllowedFirmware>
      <TargetFirmware>
        <Version>2.1</Version>
        <BinaryPath>C:\ClusterStorage\path\to\image.bin</BinaryPath>
      </TargetFirmware>
    </Disk>
    <Disk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </Disk>
  </Disks>

  <Cache>
    <CacheDisk>
      <Manufacturer>Fabrikam</Manufacturer>
      <Model>QRSTUV</Model>
    </CacheDisk>
  </Cache>

</Components>

Para listar várias unidades, basta adicionar marcas adicionais <Disk> ou <CacheDisk> .

Para injetar esse XML ao implantar Espaços de Armazenamento Diretos, use o -XML parâmetro :

$MyXML = Get-Content <Filepath> | Out-String
Enable-ClusterS2D -XML $MyXML

Para definir ou modificar o Documento de Componentes Com Suporte depois que Espaços de Armazenamento Diretos tiver sido implantado:

$MyXML = Get-Content <Filepath> | Out-String
Get-StorageSubSystem Cluster* | Set-StorageHealthSetting -Name "System.Storage.SupportedComponents.Document" -Value $MyXML

Observação

As propriedades de modelo, fabricante e versão do firmware devem corresponder exatamente aos valores que você obtém usando o cmdlet Get-PhysicalDisk. Isso pode ser diferente de sua expectativa de "senso comum", dependendo da implementação do fornecedor. Por exemplo, em vez de "Contoso", o fabricante pode ser "CONTOSO-LTD" ou pode estar em branco, enquanto o modelo é "Contoso-XZY9000".

Você pode verificar usando o seguinte cmdlet do PowerShell:

Get-PhysicalDisk | Select Model, Manufacturer, FirmwareVersion

Configurações do Serviço de Integridade

Modifique as configurações do Serviço de Integridade para ajustar a agressividade de falhas ou ações, ativar ou desativar determinados comportamentos e muito mais. Confira Modificar configurações do Serviço de Integridade.

Referências adicionais