Freigeben über


Reparieren eines Knotens in Azure Local

Gilt für: Azure Local 2311.2 und höher

Dieser Artikel beschreibt, wie Sie einen Knoten auf Ihrer Azure Local-Instanz reparieren. In diesem Artikel wird jeder Server als Knoten bezeichnet.

Über Reparaturknoten

Azure Local ist ein hyperkonvergentes System, mit dem Sie Knoten von bestehenden Systemen reparieren können. Möglicherweise müssen Sie einen Knoten in einem System reparieren, wenn ein Hardwarefehler vorliegt.

Bevor Sie einen Knoten reparieren, sollten Sie mit Ihrem Lösungsanbieter klären, bei welchen Komponenten des Knotens es sich um Field Replacement Units (FRUs) handelt, die Sie selbst austauschen können, und welche Komponenten von einem Techniker ausgetauscht werden müssen.

Im Gegensatz zu Komponenten, die nicht bei laufendem Betrieb ausgetauscht werden können, wie etwa Hauptplatinen, muss für Teile, die den Austausch bei laufendem Betrieb unterstützen, in der Regel kein Reimaging des Knotens durchgeführt werden. Wenden Sie sich an den Hersteller Ihrer Hardware, um herauszufinden, bei welchem Austausch von Komponenten Sie den Node neu installieren müssen. Weitere Informationen finden Sie unter Komponentenersatz.

Reparaturknoten-Workflow

Das folgende Flussdiagramm zeigt den gesamten Prozess zur Reparatur eines Knotens.

Diagramm zur Veranschaulichung des Reparaturknotenprozesses.

*Der Knoten befindet sich möglicherweise nicht in einem Zustand, in dem das Herunterfahren möglich oder erforderlich ist.*

Um einen bestehenden Knoten zu reparieren, folgen Sie diesen allgemeinen Schritten:

  1. Wenn möglich, schalten Sie den Knoten, den Sie reparieren möchten, aus. Je nach Status des Knotens ist ein Herunterfahren möglicherweise nicht möglich oder erforderlich.

  2. Führen Sie eine Neuinstallation des zu reparierenden Knotens durch.

  3. Führen Sie die Operation Knoten reparieren aus. Das Azure Stack HCI-Betriebssystem, die Treiber und die Firmware werden im Rahmen des Reparaturvorgangs aktualisiert.

    Der Speicher wird auf dem neu abgebildeten Knoten automatisch neu ausgeglichen. Der Speicherausgleich ist eine Aufgabe mit niedriger Priorität, die je nach Anzahl der Knoten und des verwendeten Speichers mehrere Tage lang laufen kann.

Unterstützte Szenarios

Durch das Reparieren eines Knotens wird ein Reimaging für den Knoten durchgeführt und mit dem vorherigen Namen und der vorherigen Konfiguration wieder im System hergestellt.

Das Reparieren eines einzelnen Knotens führt zu einer erneuten Bereitstellung mit der Option zum dauerhaften Speichern der Datenvolumes. Bei der Bereitstellung wird nur das Systemvolume gelöscht und neu bereitgestellt.

Wichtig

Stellen Sie sicher, dass Sie immer Backups für Ihre Arbeitslasten haben und verlassen Sie sich nicht nur auf die Ausfallsicherheit des Systems. Dies ist besonders in Szenarien mit nur einem Knoten kritisch.

Resilienz-Einstellungen

In dieser Version werden für einen Reparaturknotenvorgang bestimmte Aufgaben nicht auf den Workloadvolumes ausgeführt, die Sie nach der Bereitstellung erstellt haben. Bei einem Reparaturvorgang für den Knoten werden nur die erforderlichen Infrastrukturvolumes und die Workloadvolumes wiederhergestellt und als CSVs (Cluster Shared Volumes, freigegebene Clustervolumes) dargestellt.

Die anderen Workload-Volumes, die Sie nach der Bereitstellung erstellt haben, bleiben erhalten und Sie können diese Volumes ermitteln, indem Sie das Cmdlet Get-VirtualDisk ausführen. Sie müssen das Volume manuell entsperren (wenn das Volume BitLocker aktiviert hat) und eine CSV-Datei erstellen (falls erforderlich).

Hardwareanforderungen

Bei der Reparatur eines Knotens prüft das System die Hardware des neuen, eingehenden Knotens und stellt sicher, dass der Knoten die Hardwareanforderungen erfüllt, bevor er dem System hinzugefügt wird.

Komponente Compliance-Check
Zentrale Verarbeitungseinheit (CPU) Überprüfen Sie, ob der neue Knoten die gleiche oder eine höhere Anzahl von CPU-Kernen hat. Wenn die CPU-Kerne auf dem eingehenden Knoten diese Anforderung nicht erfüllen, wird eine Warnung angezeigt. Die Operation ist jedoch erlaubt.
Arbeitsspeicher Überprüfen Sie, ob auf dem neuen Knoten dieselbe oder eine größere Menge an Arbeitsspeicher installiert ist. Wenn der Speicher auf dem eingehenden Knoten diese Anforderung nicht erfüllt, wird eine Warnung angezeigt. Die Operation ist jedoch erlaubt.
Laufwerke Überprüfen Sie, ob auf dem neuen Knoten die gleiche Anzahl von Datenlaufwerken für Storage Spaces Direct verfügbar ist. Wenn die Anzahl der Laufwerke auf dem eingehenden Knoten diese Anforderung nicht erfüllt, wird ein Fehler gemeldet und der Vorgang wird blockiert.

Knotenpunkt ersetzen

Sie können den gesamten Knoten ersetzen:

  • Mit einem neuen Knoten, der eine andere Seriennummer hat als der alte Knoten.
  • Durch den aktuellen Knoten, nachdem Sie ein Reimaging dafür durchgeführt haben

Die folgenden Szenarien werden beim Austausch von Knoten unterstützt:

Konten Datenträger Unterstützt
Neuer Knoten Neue Datenträger Ja
Neuer Knoten Aktuelle Datenträger Ja
Aktueller Knoten (neu abgebildet) Neue Datenträger Ja
Aktueller Knoten (neu abgebildet) Aktuelle Datenträger Ja
Aktueller Knoten (neu abgebildet) Aktuelle Datenträger neu formatiert Nein

Wichtig

Wenn Sie während der Knotenreparatur eine Komponente ersetzen, müssen Sie die Datenlaufwerke nicht ersetzen oder zurücksetzen. Wenn Sie ein Laufwerk ersetzen oder zurücksetzen, wird das Laufwerk nicht mehr erkannt, sobald der Knoten dem System beitritt.

Komponentenaustausch

Zu den nicht im laufenden Betrieb austauschbaren Komponenten auf Ihrer Azure Local-Instanz gehören die folgenden Elemente:

  • Hauptplatine/Baseboard-Verwaltungscontroller (BMC)/Grafikkarte
  • Datenträgercontroller/Hostbusadapter (HBA)/Backplate
  • Netzwerkadapter
  • Grafikprozessor
  • Datenlaufwerke (Laufwerke, die den Austausch bei laufendem Betrieb nicht unterstützen, z. B. PCI-e-Add-In-Karten)

Die tatsächlichen Austauschschritte für Komponenten, die nicht bei laufendem Betrieb ausgetauscht werden können, variieren je nach OEM-Hardwareanbieter (Originalgerätehersteller). Informieren Sie sich in der Dokumentation Ihres OEM-Herstellers, ob eine Knotenreparatur für nicht hot-swap-fähige Komponenten erforderlich ist.

Voraussetzungen

Bevor Sie einen Knoten reparieren, müssen Sie sicherstellen, dass:

  • AzureStackLCMUser ist in Active Directory aktiv. Weitere Informationen finden Sie unter Vorbereiten des Active Directory.
  • Angemeldet als AzureStackLCMUser oder ein anderer Benutzer mit entsprechenden Rechten.
  • Die Anmeldeinformationen für die AzureStackLCMUser haben sich nicht geändert.

Einen Knoten reparieren

In diesem Abschnitt wird beschrieben, wie Sie einen Knoten mithilfe von PowerShell reparieren, den Status des Repair-Server -Vorgangs überwachen und bei Problemen eine Problembehandlung durchführen.

Stellen Sie sicher, dass Sie die Voraussetzungenüberprüft haben.

Befolgen Sie diese Schritte auf dem Knoten, den Sie zu reparieren versuchen.

  1. Melden Sie sich im Azure-Portal mit der Berechtigung der Rolle Azure Stack HCI Administrator an.

    1. Wechseln Sie zu der Ressourcengruppe, die zum Bereitstellen Ihrer lokalen Azure-Instanz verwendet wird. Identifizieren Sie in der Ressourcengruppe die Azure Arc-Computerressource für den fehlerhaften Knoten, den Sie reparieren möchten.

    2. Gehen Sie in der Azure Arc Maschinen-Ressource zu Einstellungen > Locks. Im rechten Fensterbereich sehen Sie eine Ressourcensperre.

    3. Wählen Sie die Sperre und dann das Papierkorbsymbol aus, um die Sperre zu löschen.

      Screenshot des Löschens der Ressourcensperre auf dem fehlerhaften Azure Arc-Computerknoten.

    4. Wählen Sie auf der Seite Übersicht der Azure Arc-Maschinenressource im rechten Bereich Löschen. Diese Aktion sollte den fehlerhaften Computerknoten löschen.

      Screenshot des Löschens eines fehlerhaften Azure Arc-Computerknotens.

  2. Installieren Sie das Betriebssystem und die erforderlichen Treiber auf dem Knoten, den Sie reparieren möchten. Folgen Sie den Schritten in Installieren Sie das Azure Stack HCI-Betriebssystem, Version 23H2.

    Hinweis

    • Für Die Versionen 2503 und höher müssen Sie das Betriebssystemimage derselben Lösung wie die auf dem vorhandenen Cluster ausgeführte Lösung verwenden.
    • Verwenden Sie die Funktion Get Solution Version, um die Lösungsversion zu identifizieren, die auf dem Cluster ausgeführt wird.
    • Verwenden Sie die Bildtabelle des Betriebssystems , um die entsprechende Betriebssystemimageversion zu identifizieren und herunterzuladen.
  3. Registrieren Sie den Knoten bei Arc. Folgen Sie den Schritten in Bei Arc registrieren und Berechtigungen einrichten.

    Hinweis

    Sie müssen dieselben Parameter wie für die vorhandenen Knoten verwenden, um sich bei Arc zu registrieren. Beispiel: Ressourcengruppenname, Region, Abonnement und Mandant.

  4. Weisen Sie dem reparierten Knoten die folgenden Berechtigungen zu:

Führen Sie diese Schritte auf einem anderen Knoten aus, der Mitglied derselben Azure Local-Instanz ist.

  1. Melden Sie sich an dem Knoten, der bereits Mitglied des Systems ist, mit den Anmeldedaten des Domänenbenutzers an, die Sie bei der Einrichtung des Systems angegeben haben. Führen Sie den folgenden Befehl aus, um den eingehenden Knoten zu reparieren:

    $Cred = Get-Credential 
    Repair-Server -Name "<Name of the new node>" -LocalAdminCredential $Cred
    

    Hinweis

    Der Knotenname muss der NetBIOS-Namesein. Der Parameter LocalAdminCredential standardmäßig ist das integrierte Administratorkonto, das von der Windows OS-Installation erstellt wurde.

  2. Notieren Sie sich die vom Repair-Server Befehl ausgegebene Vorgangs-ID. Sie verwenden dies später, um den Fortschritt der Operation Repair-Server zu überwachen.

Fortschritt der Operation überwachen

Um den Fortschritt des Vorgangs "Knoten hinzufügen" zu überwachen, gehen Sie wie folgt vor:

  1. Führen Sie das folgende Cmdlet aus und geben Sie die Vorgangs-ID aus dem vorherigen Schritt an.

    $ID = "<Operation ID>" 
    Start-MonitoringActionplanInstanceToComplete -actionPlanInstanceID $ID 
    
  2. Nachdem der Vorgang abgeschlossen ist, wird der Storage Rebalancing Job im Hintergrund weiter ausgeführt. Warten Sie auf das Abschließen des Storage Rebalancing Jobs. Um den Fortschritt dieses Storage-Rebalancing-Auftrags zu überprüfen, verwenden Sie das folgende Cmdlet:

    Get-VirtualDisk|Get-StorageJob
    

    Wenn der Speicherausgleichsauftrag abgeschlossen ist, gibt das Cmdlet keine Ausgabe zurück.

Wiederherstellungsszenarien

Die folgenden Wiederherstellungsszenarien und die empfohlenen Abhilfemaßnahmen für die Reparatur eines Knotens sind tabellarisch aufgeführt:

Beschreibung des Szenarios Minderung Unterstützt?
Fehler beim Vorgang zum Reparieren des Knotens Um den Vorgang abzuschließen, untersuchen Sie den Fehler.
Führen Sie den fehlerhaften Vorgang mithilfe von Repair-Server -Rerun erneut aus.
Ja
Die Reparatur des Knotens war teilweise erfolgreich, aber ich musste mit einer neuen Installation des Betriebssystems beginnen. In diesem Szenario hat der Orchestrator (auch bekannt als Lifecycle Manager) seinen Wissensspeicher bereits mit dem neuen Knoten aktualisiert. Verwenden Sie das Szenario Reparaturknoten. Ja

Problembehandlung

Wenn beim Reparieren eines Knotens Ausfälle oder Fehler auftreten, können Sie die Ausgabe der Ausfälle in einer Protokolldatei erfassen.

  • Melden Sie sich mit den Anmeldedaten des Domänenbenutzers an, die Sie bei der Einrichtung des Systems angegeben haben. Erfassen Sie das Problem in den Protokolldateien.

    Get-ActionPlanInstance -ActionPlanInstanceID $ID |out-file log.txt
    
  • Um den fehlgeschlagenen Vorgang erneut auszuführen, verwenden Sie das folgende Cmdlet:

    Repair-Server -Rerun
    

Wenn während des Reparaturknotenvorgangs ein Problem auftritt und Sie Hilfe vom Microsoft Support benötigen, können Sie die Schritte unter Diagnoseprotokolle für Azure Local (Vorschau) ausführen, um Diagnoseprotokolle zu sammeln und an Microsoft zu senden.

Möglicherweise müssen Sie Diagnoseprotokolle des zu reparierenden Knotens zur Verfügung stellen. Stellen Sie sicher, dass Sie das Cmdlet Send-DiagnosticData von diesem Knoten aus ausführen.

Nächste Schritte

Erfahren Sie mehr darüber, wie Sie einen Knoten hinzufügen.