Share via


Aktivieren der Bereinigung für inaktive Knoten

Azure Operator Nexus führt ein neues Feature namens Node down sauber er ein, das standardmäßig deaktiviert ist. Es hilft beim Verschieben von NFS-Server-Pods von einem fehlgeschlagenen Knoten zu einem neuen Knoten, wenn ein Bare Metal Host über AZ CLI ausgeschaltet wird. Das folgende Verfahren ermöglicht knotenab sauber er und gilt sowohl für Grünfeld- als auch für braune Feldumgebungen.

Voraussetzungen

  • In diesem Artikel wird davon ausgegangen, dass Sie die Azure-Befehlszeilenschnittstelle und die networkcloud Befehlszeilenschnittstellenerweiterung installiert haben. Weitere Informationen finden Sie unter Installieren von CLI-Erweiterungen.
  • Angemeldet bei Azure CLI mit dem richtigen Abonnement
  • Der Energiezustand der Ziel-Bare-Metal-Maschine ist aktiviert und hat "readyState" auf "True" festgelegt.
  • Der Benutzer muss über die entsprechende Berechtigung zum Ausführen der networkcloud baremetalmachine run-command

Schritte zum Aktivieren von Knoten nach unten sauber er im Cluster

Die Prozedur muss für Verwaltungsknoten ausgeführt werden. Um zu ermitteln, welche Knoten Verwaltungsknoten sind, können Sie die folgende Azure CLI baremetalmachine run-read-commandausführen.

az networkcloud baremetalmachine run-read-command --name <any-ready-baremetal-machine> \
  --commands "[{command:'kubectl get',arguments:[nodes,-l,platform.afo-nc.microsoft.com/role=control-plane]}]" \
  --limit-time-seconds 60 \
  --resource-group <cluster-managed-resource-group> \
  --subscription <subscription>

Führen Sie den folgenden Befehl aus, um Knoten nach unten sauber er zu aktivieren.

az networkcloud baremetalmachine run-command --bare-metal-machine-name <management-node-baremetal-machine> \
--subscription <subscription> \
--resource-group <cluster-managed-resource-group> \
--limit-time-seconds 60 \
--script "IyEvYmluL2Jhc2gKCmt1YmVjdGwgZ2V0IGRlcGxveW1lbnQgLW4gbmMtc3lzdGVtIG5vZGUtZG93
bi1jbGVhbmVyCgprdWJlY3RsIHNjYWxlIGRlcGxveW1lbnQgLW4gbmMtc3lzdGVtIG5vZGUtZG93
bi1jbGVhbmVyIC0tcmVwbGljYXM9MQoKa3ViZWN0bCBnZXQgZGVwbG95bWVudCAtbiBuYy1zeXN0
ZW0gbm9kZS1kb3duLWNsZWFuZXIKCmt1YmVjdGwgZ2V0IHBvZHMgLW4gbmMtc3lzdGVtIC1sIGFw
cC5rdWJlcm5ldGVzLmlvL25hbWU9bm9kZS1kb3duLWNsZWFuZXIKCg=="

Das Skript führt die folgenden Kubectl-Befehle aus:

kubectl get deployment -n nc-system node-down-cleaner

kubectl scale deployment -n nc-system node-down-cleaner --replicas=1

kubectl get deployment -n nc-system node-down-cleaner

sleep 5s

kubectl get pods -n nc-system -l app.kubernetes.io/name=node-down-cleaner

Bei der Ausführung des Ausführungsbefehls der Baremetalmachine wird der Knoten nach unten sauber er auf ein Replikat skaliert, und sein Pod sollte sich im Ausführungszustand befinden. Die Ausgabe würde wie folgt aussehen:

====Action Command Output====
NAME                READY   UP-TO-DATE   AVAILABLE   AGE
node-down-cleaner   0/0     0            0           4d9h
deployment.apps/node-down-cleaner scaled
NAME                READY   UP-TO-DATE   AVAILABLE   AGE
node-down-cleaner   0/1     1            0           4d9h
NAME                                 READY   STATUS    RESTARTS   AGE
node-down-cleaner-xxxxxxxxxxxxxx   1/1     Running   0          5s