Ripristinare un server in Azure Stack HCI, versione 23H2

Si applica a: Azure Stack HCI, versione 23H2

Questo articolo descrive come ripristinare un server nel cluster Azure Stack HCI.

Informazioni sui server di ripristino

Azure Stack HCI è un sistema iperconvergente che consente di ripristinare i server dai cluster esistenti. Potrebbe essere necessario ripristinare un server in un cluster in caso di errore hardware.

Prima di ripristinare un server, assicurarsi di verificare con il provider di soluzioni, quali componenti nel server sono unità di sostituzione dei campi (FRU) che è possibile sostituire manualmente e quali componenti richiederebbero che un tecnico sostituisca.

Le parti che supportano lo scambio ad accesso frequente in genere non richiedono la ricreazione dell'immagine del server, a differenza dei componenti non scambiabili a caldo, ad esempio la scheda madre. Consultare il produttore dell'hardware per determinare quali sostituzioni dei componenti richiederebbero la ricreazione dell'immagine del server. Per altre informazioni, vedere Sostituzione dei componenti.

Ripristinare il flusso di lavoro del server

Il diagramma di flusso seguente illustra il processo complessivo per ripristinare un server.

Diagramma che illustra il processo del server di ripristino.

*Il server potrebbe non trovarsi in uno stato in cui l'arresto è possibile o necessario

Per ripristinare un server esistente, seguire questa procedura generale:

  1. Se possibile, arrestare il server da ripristinare. A seconda dello stato del server, un arresto potrebbe non essere possibile o necessario.

  2. Ricreazione dell'immagine del server che deve essere ripristinato.

  3. Eseguire l'operazione del server di ripristino. Il sistema operativo, i driver e il firmware di Azure Stack HCI vengono aggiornati come parte dell'operazione di ripristino.

    Lo spazio di archiviazione viene ribilanciato automaticamente nel server ricreato. Il ribilanciamento dell'archiviazione è un'attività con priorità bassa che può essere eseguita per più giorni a seconda del numero di server e dell'archiviazione usata.

Scenari supportati

Il ripristino di un server ricrea l'immagine di un server e lo riporta al cluster con il nome e la configurazione precedenti.

Il ripristino di un singolo server comporta una ridistribuzione con l'opzione per rendere persistenti i volumi di dati. Solo il volume di sistema viene eliminato e appena sottoposto a provisioning durante la distribuzione.

Importante

Assicurarsi di avere sempre backup per i carichi di lavoro e di non basarsi solo sulla resilienza del sistema. Ciò è particolarmente critico negli scenari a server singolo.

Impostazioni di resilienza

In questa versione, per l'operazione di ripristino del server, le attività specifiche non vengono eseguite sui volumi del carico di lavoro creati dopo la distribuzione. Per l'operazione di ripristino del server, solo i volumi di infrastruttura necessari e i volumi del carico di lavoro vengono ripristinati e visualizzati come volumi condivisi del cluster.

Gli altri volumi del carico di lavoro creati dopo la distribuzione vengono ancora conservati ed è possibile individuare questi volumi eseguendo Get-VirtuaDisk il cmdlet . Sarà necessario sbloccare manualmente il volume (se il volume è abilitato per BitLocker) e creare un file CSV (se necessario).

Requisiti hardware

Durante il ripristino di un server, il sistema convalida l'hardware del nuovo server in ingresso e garantisce che il server soddisfi i requisiti hardware prima dell'aggiunta al cluster.

Componente Controllo della conformità
CPU Verificare che il nuovo server abbia lo stesso numero di o più core CPU. Se i core CPU nel nodo in ingresso non soddisfano questo requisito, viene visualizzato un avviso. L'operazione è tuttavia consentita.
Memoria Verificare che nel nuovo server sia installata la stessa quantità di memoria o più. Se la memoria nel nodo in ingresso non soddisfa questo requisito, viene visualizzato un avviso. L'operazione è tuttavia consentita.
Unità Verificare che il nuovo server abbia lo stesso numero di unità dati disponibili per Spazi di archiviazione diretta. Se il numero di unità nel nodo in ingresso non soddisfa questo requisito, viene segnalato un errore e l'operazione viene bloccata.

Sostituzione del server

È possibile sostituire l'intero server:

  • Con un nuovo server con un numero di serie diverso rispetto al server precedente.
  • Con il server corrente dopo averlo ricreato l'immagine.

Durante la sostituzione del server sono supportati gli scenari seguenti:

Server Disco Supportato
Nuovo server Nuovi dischi
Nuovo server Dischi correnti
Server corrente (ricreazione dell'immagine) I dischi correnti sono stati riformattati * No
Server corrente (ricreazione dell'immagine) Nuovi dischi
Server corrente (ricreazione dell'immagine) Dischi correnti

**I dischi usati da Spazi di archiviazione diretta richiedono una corretta pulizia. La riformattazione non è sufficiente. Vedere come pulire le unità.

Importante

Se si sostituisce un componente durante il ripristino del server, non è necessario sostituire o reimpostare le unità dati. Se si sostituisce un'unità o la si reimposta, l'unità non verrà riconosciuta dopo che il server viene aggiunto al cluster.

Sostituzione di componenti

Nel cluster Azure Stack HCI, i componenti non con scambio ad accesso frequente includono gli elementi seguenti:

  • Scheda madre/Controller BMC (Baseboard Management Controller)/Scheda video
  • Controller disco/scheda bus host (HBA)/backplace
  • Scheda di rete
  • Unità di elaborazione grafica
  • Unità dati (unità che non supportano lo swapping a caldo, ad esempio schede di componenti aggiuntivi PCI-e)

I passaggi di sostituzione effettivi per i componenti non con scambio a caldo variano in base al fornitore dell'hardware oem (Original Equipment Manufacturer). Vedere la documentazione del fornitore OEM se è necessaria una riparazione del server per i componenti non scambiabili a caldo.

Prerequisiti

Prima di ripristinare un server, è necessario assicurarsi che:

  • AzureStackLCMUser è attivo in Active Directory. Per altre informazioni, vedere Preparare Active Directory.
  • Accesso come AzureStackLCMUser o un altro utente con autorizzazioni equivalenti.
  • Le credenziali per l'oggetto AzureStackLCMUser non sono state modificate.

Ripristinare un server

Questa sezione descrive come ripristinare un server con PowerShell, monitorare lo stato dell'operazione Repair-Server e risolvere i problemi, se si verificano problemi.

Assicurarsi di aver esaminato i prerequisiti.

Seguire questa procedura nel server che si sta tentando di ripristinare.

  1. Installare il sistema operativo e i driver necessari. Seguire la procedura descritta in Installare Azure Stack HCI, versione 23H2 Del sistema operativo.

    Nota

    È anche necessario installare i ruoli di Windows necessari.

  2. Registrare il server con Arc. Seguire la procedura descritta in Registrare con Arc e configurare le autorizzazioni.

    Nota

    È necessario usare gli stessi parametri dei nodi esistenti per registrare con Arc. Ad esempio: Nome gruppo di risorse, Area, Sottoscrizione e Tentant.

Seguire questa procedura in un altro server membro dello stesso cluster Azure Stack HCI.

  1. Prima di aggiungere il server, assicurarsi di ottenere un token di autenticazione aggiornato. Eseguire il comando seguente:

     Update-AuthenticationToken
    
  2. Accedere al server che è già membro del cluster, con le credenziali utente di dominio fornite durante la distribuzione del cluster. Eseguire il comando seguente per ripristinare il server in ingresso:

    $Cred = Get-Credential 
    Repair-Server -Name "< Name of the new server>" -LocalAdminCredential $Cred
    
  3. Prendere nota dell'ID operazione come output dal Repair-Server comando. Questa operazione viene usata in un secondo momento per monitorare lo stato di avanzamento dell'operazione Repair-Server .

Monitorare lo stato di avanzamento dell'operazione

Per monitorare lo stato di avanzamento dell'operazione add server, seguire questa procedura:

  1. Eseguire il cmdlet seguente e specificare l'ID operazione del passaggio precedente.

    $ID = "<Operation ID>" 
    Start-MonitoringActionplanInstanceToComplete -actionPlanInstanceID $ID 
    
  2. Al termine dell'operazione, il processo di ribilanciamento dell'archiviazione in background continuerà a essere eseguito. Attendere il completamento del processo di ribilanciamento dell'archiviazione. Per verificare lo stato di avanzamento del processo di ribilanciamento dell'archiviazione, usare il cmdlet seguente:

    Get-VirtualDisk|Get-StorageJob
    

    Se il processo di ribilanciamento dell'archiviazione è stato completato, il cmdlet non restituirà un output.

Scenari di ripristino

Gli scenari di ripristino seguenti e i passaggi di mitigazione consigliati vengono tabulati per la riparazione di un server:

Descrizione dello scenario Strategia di riduzione del rischio Supportata
Operazione del server di ripristino non riuscita. Per completare l'operazione, analizzare l'errore.
Eseguire nuovamente l'operazione non riuscita usando Add-Server -Rerun.
L'operazione di ripristino del server ha avuto esito parziale, ma ha dovuto iniziare con un'installazione nuova del sistema operativo. In questo scenario, l'agente di orchestrazione (noto anche come Gestione ciclo di vita) ha già aggiornato il relativo archivio conoscenze con il nuovo server. Usare lo scenario del server di ripristino.

Risoluzione dei problemi

Se si verificano errori o errori durante la riparazione di un server, è possibile acquisire l'output degli errori in un file di log.

  • Accedere con le credenziali utente del dominio fornite durante la distribuzione del cluster. Acquisire il problema nei file di log.

    Get-ActionPlanInstance -ActionPlanInstanceID $ID |out-file log.txt
    
  • Per eseguire nuovamente l'operazione non riuscita, usare il cmdlet seguente:

    Repair-Server -Rerun
    

Passaggi successivi

Altre informazioni su come aggiungere un server.