Condividi tramite


Comprendere e monitorare la risincronizzazione dell'archiviazione

Si applica a: Azure Stack HCI, versioni 22H2 e 21H2; Windows Server 2022, Windows Server 2019

L'avviso di risincronizzazione dell'archiviazione è una funzionalità di Storage Spaces Direct in Azure Stack HCI e Windows Server. Consente al servizio sanitario di generare un errore, notificando la ri-sincronizzazione. In questo modo è possibile evitare l'arresto accidentale di più server, che potrebbe influire su più domini di guasto, portando al blocco del cluster.

Questo articolo offre una panoramica della risincronizzazione dell'archiviazione e di come monitorarla in un cluster di failover con Spazi di archiviazione diretta.

Informazioni sulla risincronizzazione dell'archiviazione

Si inizierà con un semplice esempio per comprendere come l'archiviazione potrebbe uscire dalla sincronizzazione. Tenere presente che qualsiasi soluzione di archiviazione distribuita non condivisa (solo unità locali) presenta questo comportamento. La sezione seguente illustra come l'archiviazione non viene sincronizzata quando un nodo del server diventa inattivo. Le sue unità non vengono aggiornate finché non tornano online. Questo comportamento è applicabile a qualsiasi architettura iperconvergente.

Si supponga di voler archiviare la stringa "HELLO".

Immagine di un ASCII di una stringa 'hello'.

Supponendo di avere una resilienza mirror a tre vie, si dispone di tre copie di questa stringa. Se si arresta temporaneamente il server n. 1 (per la manutenzione), non è possibile accedere alla copia n. 1.

Immagine che mostra che non è possibile accedere alla copia numero 1 se si arresta il server numero 1.

Si supponga di aggiornare la stringa da "HELLO" a "HELP!" al momento.

Immagine di una stringa ASCII di aiuto!

Dopo aver aggiornato la stringa, la copia n. 2 e #3 vengono aggiornate correttamente. Non è tuttavia possibile accedere alla copia n. 1 perché il server n. 1 è temporaneamente inattivo (per la manutenzione).

GIF che mostra come copiare i numeri 2 e 3.

È ora disponibile la copia n. 1 con i dati non sincronizzati. Il sistema operativo usa il rilevamento granulare dell'area dirty per tenere traccia dei bit non sincronizzati. In questo modo, quando il server n. 1 torna online, è possibile sincronizzare le modifiche leggendo i dati dalla copia n. 2 o n. 3 e sovrascrivendo i dati nella copia n. 1. Con questo approccio, è necessario copiare solo i dati non aggiornati, anziché risincronizzare tutti i dati dal server n. 2 o dal server 3.

GIF della sovrascrittura per copiare il numero 1.

La sezione precedente descrive come i dati potrebbero non essere sincronizzati. Ma che aspetto ha questo aspetto ad alto livello? Si supponga di avere un cluster iperconvergente a tre server. Quando il server n. 1 è in manutenzione, viene visualizzato come inattivo. Quando si esegue il backup del server 1, viene avviata la risincronizzazione di tutte le risorse di archiviazione usando il rilevamento granulare dell'area dirty (illustrato nella sezione precedente). Una volta che i dati vengono nuovamente sincronizzati, tutti i server vengono visualizzati come operativi.

La GIF seguente illustra il funzionamento della risincronizzazione dell'archiviazione in un cluster iperconvergente:

GIF della vista amministratore per la risincronizzazione.

Come monitorare la risincronizzazione dell'archiviazione

A partire da Windows Server 2019, è stato aggiunto un nuovo errore al servizio integrità che viene segnalato quando la risorsa di archiviazione viene risincronizzata.

Per visualizzare questo errore in PowerShell, eseguire il cmdlet seguente:

Get-HealthFault

Questo nuovo guasto appare in PowerShell, nel report di convalida del cluster e in qualsiasi altra area che si basa su guasti relativi alla salute del sistema.

Per ottenere una visualizzazione più approfondita, è possibile eseguire query sul database time series in PowerShell, come indicato di seguito:

Get-ClusterNode | Get-ClusterPerf -ClusterNodeSeriesName ClusterNode.Storage.Degraded

Di seguito è riportato un esempio dell'output:

Object Description: ClusterNode Server1

Series                       Time                Value Unit
------                       ----                ----- ----
ClusterNode.Storage.Degraded 01/11/2019 16:26:48     214 GB

Windows Admin Center usa i guasti di integrità per impostare lo stato e il colore dei nodi del cluster. Nel dashboard HCI questo nuovo errore consente ai nodi del cluster di passare dal rosso (verso il basso) al giallo (risincronizzazione) al verde (su), invece di passare direttamente dal rosso al verde.

L'immagine seguente confronta l'avanzamento della risincronizzazione dell'archiviazione in Windows Server 2016 rispetto a Windows Server 2019.

immagine di Windows Server 2016 in confronto con la visualizzazione di Windows Server 2019 di risincronizzazione.

Mostrando lo stato di avanzamento complessivo della risincronizzazione dell'archiviazione, è possibile sapere con precisione la quantità di dati non sincronizzati e se il sistema sta avanzando. In Windows Admin Center passare al Dashboard per visualizzare il nuovo avviso, come illustrato nello screenshot seguente:

acquisizione dello schermo dell'avviso in Windows Admin Center.

L'avviso è utile per notificare quando si sta verificando la risincronizzazione, in modo da non arrestare accidentalmente più server (che potrebbero causare effetti su più domini di errore, con conseguente arresto del cluster).

Per ottenere una visualizzazione dettagliata del modo in cui la risincronizzazione dell'archiviazione viene visualizzata in base al server in Windows Admin Center, passare alla pagina server, fare clic su Inventarioe quindi scegliere un server specifico. Passare al server e osservare il grafico archiviazione per visualizzare la quantità di dati che devono essere riparati in una linea viola con il numero esatto subito sopra. Questa quantità aumenta quando il server è inattivo (è necessario risincronizzare più dati) e diminuisce gradualmente quando il server torna online (i dati vengono sincronizzati). Quando la quantità di dati da ripristinare è 0, la tua risorsa di archiviazione ha terminato la risincronizzazione—ora sei libero di arrestare un server se necessario.

Lo screenshot seguente mostra la visualizzazione server in Windows Admin Center:

l'acquisizione dello schermo della visualizzazione server in Windows Admin Center.

Come monitorare la risincronizzazione dell'archiviazione in Windows Server 2016

L'avviso disponibile in Windows Server 2019 e versioni successive è utile per ottenere una visualizzazione olistica di ciò che accade a livello di archiviazione. Riepiloga le informazioni che è possibile ottenere dal cmdlet Get-StorageJob. Questo cmdlet restituisce informazioni sui processi del modulo di archiviazione a esecuzione prolungata, ad esempio un'operazione di ripristino in uno spazio di archiviazione, come illustrato nell'output di esempio seguente.

Get-StorageJob

Di seguito è riportato un esempio di output:

Name                  ElapsedTime           JobState              PercentComplete       IsBackgroundTask
----                  -----------           --------              ---------------       ----------------
Regeneration          00:01:19              Running               50                    True

Questa vista è più granulare perché i processi di archiviazione sono elencati per volume. È possibile visualizzare l'elenco dei processi in esecuzione e tenere traccia dello stato di avanzamento individuale. Questo cmdlet funziona sia in Windows Server 2016 che in 2019.

Riferimenti aggiuntivi