Comprendere e monitorare risincronizzazione di archiviazione

Si applica a: Azure Stack HCI, versioni 22H2 e 21H2; Windows Server 2022, Windows Server 2019

L'avviso di risincronizzazione dell'archiviazione è una funzionalità di Spazi di archiviazione diretta in Azure Stack HCI e Windows Server. Consente al servizio integrità di generare un errore, notificando l'utente sulla risincrona. Ciò consente di impedire l'arresto accidentale di più server, che potrebbero influire su più domini di errore che causano l'arresto del cluster.

Questo articolo offre una panoramica della risincronizzazione dell'archiviazione e di come è possibile monitorarla in un cluster di failover con Spazi di archiviazione diretta.

Informazioni sulla risincronizzazione dell'archiviazione

Iniziamo con un semplice esempio per comprendere come l'archiviazione potrebbe uscire dalla sincronizzazione. Tenere presente che qualsiasi soluzione di archiviazione distribuita non condivisa (solo unità locali) presenta questo comportamento. La sezione seguente illustra come l'archiviazione non viene sincronizzata quando un nodo del server viene disattivato. Le unità non vengono aggiornate finché non torna online, questo comportamento è applicabile a qualsiasi architettura iperconvergente.

Si supponga di voler archiviare la stringa "HELLO".

Immagine di una s c i di una stringa hello.

Supponendo che si disponga di resilienza mirror a tre vie, sono disponibili tre copie di questa stringa. Se si disattiva il server #1 temporaneamente (per la manutenzione), non è possibile accedere alla copia #1.

Immagine che mostra che non è possibile accedere al numero di copia 1 se si accetta il numero di server 1.

Si supponga di aggiornare la stringa da "HELLO" a "HELP!" in questo momento.

Immagine di una s c i di un aiuto! Stringa.

Dopo aver aggiornato la stringa, copiare #2 e #3 correttamente. Tuttavia, la copia #1 non può essere accessibile perché il server #1 è inattivo temporaneamente (per la manutenzione).

GIF di scrittura per copiare il numero 2 e 3.

È ora disponibile la copia #1 con dati non sincronizzati. Il sistema operativo usa il rilevamento di area sporca granulare per tenere traccia dei bit non sincronizzati. In questo modo, quando il server #1 torna online, è possibile sincronizzare le modifiche leggendo i dati dalla copia #2 o #3 e sovrascrivendo i dati nella copia #1. Con questo approccio è necessario copiare solo i dati non aggiornati anziché risincronizzare tutti i dati dal server #2 o dal server #3.

GIF della sovrascrittura per copiare il numero 1.

La sezione precedente descrive come i dati potrebbero uscire dalla sincronizzazione. Ma cosa sembra ad alto livello? Si supponga di avere un cluster iperconvergente a tre server. Quando il server #1 è in manutenzione, viene visualizzato come inattivo. Quando si esegue il backup del server #1, viene avviata la risincronizzazione di tutte le risorse di archiviazione usando il rilevamento delle aree sporche granulari (illustrato nella sezione precedente). Dopo aver eseguito il backup dei dati, tutti i server vengono visualizzati come visualizzati.

La GIF seguente illustra come funziona la risincronizzazione dell'archiviazione in un cluster iperconvergente:

GIF della visualizzazione amministratore di risincrona.

Come monitorare la risincronizzazione dell'archiviazione

A partire da Windows Server 2019, è stato aggiunto un nuovo errore al servizio integrità che viene visualizzato quando la risorsa di archiviazione viene risincrona.

Per visualizzare questo errore in PowerShell, eseguire il cmdlet seguente:

Get-HealthFault

Questo nuovo errore viene visualizzato in PowerShell, nel report di convalida del cluster e in qualsiasi altro punto che si basa sugli errori di integrità.

Per ottenere una visualizzazione più approfondita, è possibile eseguire query sul database della serie temporale in PowerShell, come indicato di seguito:

Get-ClusterNode | Get-ClusterPerf -ClusterNodeSeriesName ClusterNode.Storage.Degraded

Ecco un esempio di output:

Object Description: ClusterNode Server1

Series                       Time                Value Unit
------                       ----                ----- ----
ClusterNode.Storage.Degraded 01/11/2019 16:26:48     214 GB

Windows Admin Center usa errori di integrità per impostare lo stato e il colore dei nodi del cluster. Nel dashboard HCI questo nuovo errore consente ai nodi del cluster di passare da rosso (giù) a giallo (risincrona) a verde (su), anziché andare direttamente dal rosso al verde.

L'immagine seguente confronta il modo in cui lo spazio di archiviazione viene spostato in Windows Server 2016 e Windows Server 2019.

Immagine della visualizzazione Windows Server 2016 vs Window Server 2019 di risincrona.

Visualizzando lo stato di avanzamento complessivo dello spazio di archiviazione, è possibile conoscere in modo accurato la quantità di dati non sincronizzati e se il sistema sta eseguendo lo stato di avanzamento. In Windows Admin Center passare al dashboard per visualizzare il nuovo avviso, come illustrato nello screenshot seguente:

Acquisizione dello schermo dell'avviso in Windows Admin Center.

L'avviso è utile per notificare quando si sta verificando la risincronizzazione, in modo che non si verifichino accidentalmente più server (che potrebbero causare l'effetto di più domini di errore, causando l'arresto del cluster).

Per ottenere una visualizzazione dettagliata del modo in cui l'archiviazione viene visualizzata in base al server in Windows Admin Center, passare alla pagina Server, fare clic su Inventario e quindi scegliere un server specifico. Passare al server e esaminare il grafico Archiviazione per visualizzare la quantità di dati che devono essere ripristinati in una linea viola con un numero esatto sopra di esso. Questa quantità aumenta quando il server è inattivo (più dati devono essere risynced) e diminuisce gradualmente quando il server torna online (i dati vengono sincronizzati). Quando la quantità di dati che deve essere ripristinata è 0, la risorsa di archiviazione viene eseguita in modo risyncing, è ora possibile arrestare un server se necessario.

Lo screenshot seguente mostra la visualizzazione del server in Windows Admin Center:

Acquisizione dello schermo della visualizzazione server in Windows Admin Center.

Come monitorare la risincronizzazione dell'archiviazione in Windows Server 2016

L'avviso disponibile in Windows Server 2019 e versioni successive è utile per ottenere una visualizzazione olistica di ciò che accade a livello di archiviazione. Riepiloga le informazioni che è possibile ottenere dal Get-StorageJob cmdlet. Questo cmdlet restituisce informazioni sui processi del modulo di archiviazione a esecuzione prolungata, ad esempio un'operazione di ripristino in uno spazio di archiviazione, come illustrato nell'output di esempio seguente.

Get-StorageJob

Ecco un output di esempio:

Name                  ElapsedTime           JobState              PercentComplete       IsBackgroundTask
----                  -----------           --------              ---------------       ----------------
Regeneration          00:01:19              Running               50                    True

Questa visualizzazione è più granulare perché i processi di archiviazione sono elencati per volume. È possibile visualizzare l'elenco dei processi in esecuzione e tenere traccia dei singoli progressi. Questo cmdlet funziona sia in Windows Server 2016 che in 2019.

Riferimenti aggiuntivi