Verwalten des Lebenszyklus von Bare-Metal-Computern
In diesem Artikel erfahren Sie, wie Sie Lebenszyklusverwaltungsvorgänge für Bare-Metal-Computer (Bare Metal Machines, BMM) ausführen. Diese Schritte sollten für die Problembehandlung verwendet werden – entweder für die Wiederherstellung nach Fehlern oder beim Ausführen von Wartungsaktionen. Die Befehle zum Verwalten des Lebenszyklus des Bare-Metal-Computers umfassen Folgendes:
Achtung
Führen Sie ohne vorherige Rücksprache mit dem Microsoft-Supportpersonal keine Aktionen für Verwaltungsserver durch. Andernfalls kann die Integrität des Operator Nexus-Clusters beeinträchtigt werden.
- Ausschalten des Bare-Metal-Computers
- Starten des Bare-Metal-Computers
- Neustarten des Bare-Metal-Computers
- Unplanbarmachen des Bare-Metal-Computers („cordon“ ohne „evacuate“)
- Unplanbarmachen des Bare-Metal-Computers („cordon“ mit „evacuate“)
- Planbarmachen des Bare-Metal-Computers („uncordon“)
- Durchführen eines Reimagings für den Bare-Metal-Computers
- Ersetzen des Bare-Metal-Computers
Wichtig
Unterbrechende Befehlsanforderungen für einen KCP-Knoten (Kubernetes Control Plane; Kubernetes-Steuerungsebene) werden abgelehnt, wenn bereits ein anderer unterbrechender Aktionsbefehl für einen anderen KCP-Knoten ausgeführt wird oder wenn nicht die gesamte KCP verfügbar ist. Diese Überprüfung wird durchgeführt, um die Integrität der Nexus-Instanz aufrechtzuerhalten und sicherzustellen, dass nicht mehrere KCP-Knoten aufgrund gleichzeitiger unterbrechender Aktionen funktionsunfähig werden. Wenn mehrere Knoten funktionsunfähig werden, wird der Schwellenwert für ein fehlerfreies Quorum der Kubernetes-Steuerungsebene überschritten.
Die fett formatierten Aktionen in der obigen Liste gelten als unterbrechend (ausschalten, neu starten, Reimaging durchführen, ersetzen). „cordon“ ohne „evacuate“ wird als nicht unterbrechend betrachtet. „cordon“ mit „evacuate“ wird als unterbrechend betrachtet.
Wie bereits in der Warnung erwähnt, dürfen Aktionen für Verwaltungsserver (insbesondere KCP-Knoten) nur in Absprache mit dem Microsoft-Supportpersonal ausgeführt werden.
Voraussetzungen
- Installieren Sie die neueste Version der passenden Azure CLI-Erweiterung.
- Rufen Sie den Namen der Ressourcengruppe für den Namen der vom Cluster verwalteten Ressourcengruppe (cluster_MRG) ab.
- Rufen Sie den Namen des Bare-Metal-Computers ab, für den ein Lebenszyklusverwaltungsvorgang erforderlich ist.
- Stellen Sie sicher, dass
poweredState
des Bare-Metal-Zielcomputers aufOn
undreadyState
aufTrue
festgelegt ist.- Diese Voraussetzung gilt nicht für den Befehl
start
.
- Diese Voraussetzung gilt nicht für den Befehl
Ausschalten des Bare-Metal-Computers
Durch diesen Befehl wird der angegebene Bare-Metal-Computer (bareMetalMachineName
) ausgeschaltet (power-off
).
az networkcloud baremetalmachine power-off \
--name "bareMetalMachineName" \
--resource-group "cluster_MRG"
Starten des Bare-Metal-Computers
Durch diesen Befehl wird der angegebene Bare-Metal-Computer (bareMetalMachineName
) gestartet (start
).
az networkcloud baremetalmachine start \
--name "bareMetalMachineName" \
--resource-group "cluster_MRG"
Neustarten des Bare-Metal-Computers
Durch diesen Befehl wird der angegebene Bare-Metal-Computer (bareMetalMachineName
) neu gestartet (restart
).
az networkcloud baremetalmachine restart \
--name "bareMetalMachineName" \
--resource-group "cluster_MRG"
Unplanbarmachen eines Bare-Metal-Computers (cordon)
Sie können einen Bare-Metal-Computer unplanbar machen, indem Sie den Befehl cordon
ausführen.
Wenn Sie den Befehl cordon
ausführen, werden Operator Nexus-Workloads beim Festlegen von „cordon“ nicht auf dem Bare-Metal-Computer geplant. Beim Versuch, eine Workload auf einem Bare-Metal-Computer zu erstellen, der sich im Zustand cordoned
befindet, wird die Workload in den Zustand pending
versetzt. Bereits vorhandene Workloads werden weiterhin ausgeführt.
Der cordon-Befehl unterstützt einen evacuate
-Parameter mit dem Standardwert False
.
Beim Ausführen des cordon
-Befehls mit dem Wert True
für den evacuate
-Parameter werden die Workloads, die auf dem Bare-Metal-Computer ausgeführt werden, beendet (stopped
), und der Bare-Metal-Computer wird in den Zustand pending
versetzt.
az networkcloud baremetalmachine cordon \
--evacuate "True" \
--name "bareMetalMachineName" \
--resource-group "cluster_MRG"
evacuate "True"
entfernt Workloads von diesem Knoten, während evacuate "False"
lediglich die Planung neuer Workloads verhindert.
Planbarmachen eines Bare-Metal-Computers („uncordon“)
Sie können einen Bare-Metal-Computer planbar (verwendbar) machen, indem Sie den Befehl uncordon
ausführen. Alle Workloads im Zustand pending
auf dem Bare-Metal-Computer werden neu gestartet (restarted
), wenn der Bare-Metal-Computer mittels uncordoned
planbar gemacht wird.
az networkcloud baremetalmachine uncordon \
--name "bareMetalMachineName" \
--resource-group "cluster_MRG"
Durchführen eines Reimagings für einen Bare-Metal-Computer
Sie können die Laufzeitversion auf einer BMM wiederherstellen, indem Sie den Befehl reimage
ausführen. Durch diesen Prozess wird das Runtime-Image auf dem Bare-Metal-Zielcomputer erneut bereitgestellt, und es werden Schritte ausgeführt, um dem Cluster mit den gleichen Bezeichnern erneut beizutreten. Diese Aktion wirkt sich nicht auf die Mandantenworkloaddateien auf dieser BMM aus. Wenn eine Schreib- oder Bearbeitungsaktion auf dem Knoten über den BMM-Zugriff ausgeführt wird, ist diese „Reimage“-Aktion erforderlich, um den Microsoft-Support wiederherzustellen, und die Änderungen gehen verloren, wodurch der Knoten im erwarteten Zustand wiederhergestellt wird.
Es empfiehlt sich, vor dem Ausführen des reimage
-Befehls den cordon
-Befehl mit evacuate "True"
auszuführen, um sicherzustellen, dass die Workloads des Bare-Metal-Computers entfernt werden.
Warnung
Wenn mehrere baremetalmachine replace
- oder reimage
-Befehle gleichzeitig ausgeführt werden oder replace
gleichzeitig mit reimage
ausgeführt wird, funktionieren Server nicht mehr. Achten Sie darauf, dass ein Vorgang vom Typ replace
/reimage
vollständig abgeschlossen wurde, bevor Sie einen weiteren starten.
az networkcloud baremetalmachine reimage \
–-name "bareMetalMachineName" \
--resource-group "cluster_MRG"
Ersetzen eines Bare-Metal-Computers
Verwenden Sie den replace
-Befehl, wenn auf einem Server Hardwareprobleme auftreten, die einen vollständigen oder teilweisen Hardwareaustausch erfordern. Nach dem Austausch von Komponenten wie der Hauptplatine oder der Netzwerkschnittstellenkarte (Network Interface Card, NIC) ändert sich die MAC-Adresse des Bare-Metal-Computers. Die iDRAC-IP-Adresse und der Hostname bleiben allerdings unverändert.
Warnung
Wenn mehrere baremetalmachine replace
- oder reimage
-Befehle gleichzeitig ausgeführt werden oder replace
gleichzeitig mit reimage
ausgeführt wird, funktionieren Server nicht mehr. Achten Sie darauf, dass ein Vorgang vom Typ replace
/reimage
vollständig abgeschlossen wurde, bevor Sie einen weiteren starten.
az networkcloud baremetalmachine replace \
--name "bareMetalMachineName" \
--resource-group "cluster_MRG" \
--bmc-credentials password="{password}" username="{user}" \
--bmc-mac-address "00:00:4f:00:57:ad" \
--boot-mac-address "00:00:4e:00:58:af" \
--machine-name "OS_hostname" \
--serial-number "BM1219XXX"