Gerenciar a infraestrutura de armazenamento para o Azure Stack Hub

Este artigo descreve a integridade e os status operacionais dos recursos de infraestrutura de armazenamento do Azure Stack Hub. Esses recursos incluem unidades de armazenamento e volumes. As informações neste tópico ajudam você a solucionar vários problemas, como quando uma unidade não pode ser adicionada a um pool.

Estados de volume

Para descobrir em quais volumes de estado estão, use os seguintes comandos do PowerShell:

$scaleunit_name = (Get-AzsScaleUnit)[0].name

$subsystem_name = (Get-AzsStorageSubSystem -ScaleUnit $scaleunit_name)[0].name

Get-AzsVolume -ScaleUnit $scaleunit_name -StorageSubSystem $subsystem_name | Select-Object VolumeLabel, HealthStatus, OperationalStatus, RepairStatus, Description, Action, TotalCapacityGB, RemainingCapacityGB

Aqui está um exemplo de saída mostrando um volume desanexado e um volume degradado/incompleto:

VolumeLabel HealthStatus OperationalStatus
ObjStore_1 Unknown Desanexado
ObjStore_2 Aviso {Degradado, Incompleto}

As seções a seguir listam os estados operacionais e de integridade:

Estado de integridade do volume: íntegro

Estado operacional Descrição
OK O volume está íntegro.
Abaixo do ideal Os dados não são gravados uniformemente entre unidades.

Ação: Entre em contato com o Suporte para otimizar o uso da unidade no pool de armazenamento. Antes disso, inicie o processo de coleta de arquivos de log usando as diretrizes de https://aka.ms/azurestacklogfiles. Talvez seja necessário restaurar do backup depois que a conexão com falha for restaurada.

Estado de integridade do volume: aviso

Quando o volume está em um estado de integridade de aviso, isso significa que uma ou mais cópias de seus dados não estão disponíveis, mas o Azure Stack Hub ainda pode ler pelo menos uma cópia de seus dados.

Estado operacional Descrição
Em serviço O Azure Stack Hub está reparando o volume, como depois de adicionar ou remover uma unidade. Quando o reparo for concluído, o volume deverá retornar ao estado de integridade OK.

Ação: Aguarde até que o Azure Stack Hub termine de reparar o volume e marcar o status posteriormente.
Incompleto A resiliência do volume é reduzida porque uma ou mais unidades falharam ou estão ausentes. No entanto, as unidades ausentes contêm cópias atualizadas de seus dados.

Ação: Reconecte as unidades ausentes, substitua as unidades com falha e coloque online todos os servidores offline.
Degradado A resiliência do volume é reduzida devido a uma ou mais unidades com falha ou falta, bem como cópias de dados desatualizadas nas unidades.

Ação: Reconecte as unidades ausentes, substitua as unidades com falha e coloque online todos os servidores offline.

Estado de integridade do volume: não íntegro

Quando um volume está em um estado de integridade não íntegro, alguns ou todos os dados no volume estão inacessíveis no momento.

Estado operacional Descrição
Sem redundância O volume perdeu dados porque muitas unidades falharam.

Ação: Entre em contato com o Suporte. Antes disso, inicie o processo de coleta de arquivos de log usando as diretrizes de https://aka.ms/azurestacklogfiles.

Estado de integridade do volume: desconhecido

O volume também poderá estar no estado de integridade Desconhecido se o disco virtual tiver se desanexado.

Estado operacional Descrição
Desanexado Ocorreu uma falha no dispositivo de armazenamento que pode fazer com que o volume fique inacessível. Alguns dados podem ser perdidos.

Ação:
1. Verifique a conectividade física e de rede de todos os dispositivos de armazenamento.
2. Se todos os dispositivos estiverem conectados corretamente, entre em contato com o Suporte. Antes disso, inicie o processo de coleta de arquivos de log usando as diretrizes de https://aka.ms/azurestacklogfiles. Talvez seja necessário restaurar do backup depois que a conexão com falha for restaurada.

Estados da unidade

Use os seguintes comandos do PowerShell para monitorar o estado das unidades:

$scaleunit_name = (Get-AzsScaleUnit)[0].name

$subsystem_name = (Get-AzsStorageSubSystem -ScaleUnit $scaleunit_name)[0].name

Get-AzsDrive -ScaleUnit $scaleunit_name -StorageSubSystem $subsystem_name | Select-Object StorageNode, PhysicalLocation, HealthStatus, OperationalStatus, Description, Action, Usage, CanPool, CannotPoolReason, SerialNumber, Model, MediaType, CapacityGB

As seções a seguir descrevem os estados de integridade em que uma unidade pode estar:

Estado de integridade da unidade: Íntegro

Estado operacional Descrição
OK O volume está íntegro.
Em serviço A unidade está fazendo algumas operações internas de limpeza. Quando a ação for concluída, a unidade deverá retornar ao estado de integridade OK.

Estado de integridade da unidade: Aviso

Uma unidade no estado Aviso pode ler e gravar dados com êxito, mas tem um problema.

Estado operacional Descrição
Comunicação perdida A conectividade foi perdida para a unidade.

Ação: Colocar todos os servidores online novamente. Se isso não corrigir, reconecte a unidade. Se esse estado persistir, substitua a unidade para garantir a resiliência total.
Falha preditiva Uma falha da unidade deve ocorrer em breve.

Ação: Substitua a unidade o mais rápido possível para garantir a resiliência total.
Erro de ES Ocorreu um erro temporário ao acessar a unidade.

Ação: Se esse estado persistir, substitua a unidade para garantir a resiliência total.
Erro Transitório Ocorreu um erro temporário com a unidade. Esse erro geralmente significa que a unidade não respondeu, mas também pode significar que a partição de proteção Espaços de Armazenamento Diretos foi removida inadequadamente da unidade.

Ação: Se esse estado persistir, substitua a unidade para garantir a resiliência total.
Latência anormal Às vezes, a unidade não responde e mostra sinais de falha.

Ação: Se esse estado persistir, substitua a unidade para garantir a resiliência total.
Remoção do pool O Azure Stack Hub está no processo de remover a unidade de seu pool de armazenamento.

Ação: Aguarde até que o Azure Stack Hub termine de remover a unidade e marcar o status posteriormente.
Se a status permanecer, entre em contato com o Suporte. Antes de fazer isso, inicie o processo de coleta de arquivos de log usando as diretrizes de https://aka.ms/azurestacklogfiles.
Iniciando o modo de manutenção O Azure Stack Hub está no processo de colocar a unidade no modo de manutenção. Esse estado é temporário – a unidade deve estar em breve no estado No modo de manutenção.

Ação: Aguarde até que o Azure Stack Hub conclua o processo e marcar o status posteriormente.
No modo de manutenção A unidade está no modo de manutenção, interrompendo leituras e gravações da unidade. Esse estado geralmente significa que tarefas de administração do Azure Stack Hub, como PNU ou FRU, estão operando a unidade. Mas o administrador também pode colocar a unidade no modo de manutenção.

Ação: Aguarde até que o Hub Azure Stack Hub conclua a tarefa de administração e marcar o status posteriormente.
Se a status permanecer, entre em contato com o Suporte. Antes de fazer isso, inicie o processo de coleta de arquivos de log usando as diretrizes de https://aka.ms/azurestacklogfiles.
Interrompendo o modo de manutenção O Azure Stack Hub está no processo de colocar a unidade novamente online. Esse estado é temporário – a unidade deve estar em breve em outro estado, idealmente Íntegro.

Ação: Aguarde até que o Azure Stack Hub conclua o processo e marcar o status posteriormente.

Estado de integridade da unidade: Não íntegro

Uma unidade no estado Não íntegro não pode ser gravada ou acessada no momento.

Estado operacional Descrição
Divisão A unidade se separou do pool.

Ação: Substitua a unidade por um novo disco. Se você precisar usar esse disco, remova o disco do sistema, verifique se não há dados úteis no disco, apague o disco e assegue novamente o disco.
Não utilizável O disco físico está em quarentena porque não tem suporte do fornecedor da solução. Há suporte apenas para discos aprovados para a solução e que têm o firmware de disco correto.

Ação: Substitua a unidade por um disco que tenha um fabricante aprovado e um número de modelo para a solução.
Metadados obsoletos O disco de substituição foi usado anteriormente e pode conter dados de um sistema de armazenamento desconhecido. O disco está em quarentena.

Ação: Substitua a unidade por um novo disco. Se você precisar usar esse disco, remova o disco do sistema, verifique se não há dados úteis no disco, apague o disco e assegue novamente o disco.
Metadados não reconhecidos Metadados não reconhecidos encontrados na unidade, o que geralmente significa que a unidade tem metadados de um pool diferente.

Ação: Substitua a unidade por um novo disco. Se você precisar usar esse disco, remova o disco do sistema, verifique se não há dados úteis no disco, apague o disco e assegue novamente o disco.
Falha na mídia A unidade falhou e não será mais usada pelos Espaços de Armazenamento.

Ação: Substitua a unidade o mais rápido possível para garantir a resiliência total.
Falha no hardware do dispositivo Houve uma falha no hardware desta unidade.

Ação: Substitua a unidade o mais rápido possível para garantir a resiliência total.
Atualização do firmware O Azure Stack Hub está atualizando o firmware na unidade. Esse estado é temporário e geralmente dura menos de um minuto e durante o qual outras unidades no pool lidam com todas as leituras e gravações.

Ação: Aguarde até que o Azure Stack Hub conclua a atualização e marcar o status posteriormente.
Iniciando A unidade está se preparando para a operação. Esse estado deve ser temporário – uma vez concluído, a unidade deve fazer a transição para um estado operacional diferente.

Ação: Aguarde até que o Azure Stack Hub conclua a operação e marcar o status posteriormente.

Motivos pelos quais uma unidade não pode ser agrupada

Algumas unidades simplesmente não estão prontas para estar no pool de armazenamento do Azure Stack Hub. Você pode descobrir por que uma unidade não está qualificada para pooling examinando a CannotPoolReason propriedade de uma unidade. A tabela a seguir fornece um pouco mais de detalhes sobre cada um dos motivos.

Motivo Descrição
O hardware não está em conformidade A unidade não está na lista de modelos de armazenamento aprovados especificados usando o Serviço de Integridade.

Ação: Substitua a unidade por um novo disco.
O firmware não está em conformidade O firmware na unidade física não está na lista de revisões de firmware aprovadas usando o Serviço de Integridade.

Ação: Substitua a unidade por um novo disco.
Em uso pelo cluster Atualmente, a unidade é usada por um Cluster de Failover.

Ação: Substitua a unidade por um novo disco.
Mídia removível A unidade é classificada como uma unidade removível.

Ação: Substitua a unidade por um novo disco.
Não íntegro A unidade não está em um estado íntegro e pode precisar ser substituída.

Ação: Substitua a unidade por um novo disco.
Capacidade insuficiente Há partições ocupando o espaço livre na unidade.

Ação: Substitua a unidade por um novo disco. Se você precisar usar esse disco, remova o disco do sistema, verifique se não há dados úteis no disco, apague o disco e assegue novamente o disco.
Verificação em andamento O Serviço de Integridade está verificando se a unidade ou o firmware na unidade foi aprovado para uso.

Ação: Aguarde até que o Azure Stack Hub conclua o processo e marcar o status posteriormente.
Falha na verificação O Serviço de Integridade não pôde marcar para ver se a unidade ou o firmware na unidade foi aprovado para uso.

Ação: Contate o Suporte. Antes de fazer isso, inicie o processo de coleta de arquivos de log usando as diretrizes de https://aka.ms/azurestacklogfiles.
Offline A unidade está offline.

Ação: Contate o Suporte. Antes de fazer isso, inicie o processo de coleta de arquivos de log usando as diretrizes de https://aka.ms/azurestacklogfiles.