Udostępnij za pośrednictwem


Zarządzanie cyklem życia maszyn bez systemu operacyjnego

W tym artykule opisano sposób wykonywania operacji zarządzania cyklem życia na maszynach bez systemu operacyjnego (BMM). Te kroki powinny być używane do rozwiązywania problemów w celu odzyskania sprawności po awarii lub podczas wykonywania akcji konserwacji. Polecenia do zarządzania cyklem życia programu BMM obejmują:

Uwaga

Nie wykonuj żadnych działań na serwerach zarządzania bez uprzedniej konsultacji z personelem pomocy technicznej firmy Microsoft. Może to mieć wpływ na integralność klastra Operator Nexus.

  • Wyłączanie programu BMM
  • Uruchamianie programu BMM
  • Uruchom ponownie program BMM
  • Nie można anulować programu BMM (kordon bez ewakuacji)
  • Nie można anulować programu BMM (kordon z ewakuacją)
  • Uchwalenie programu BMM (niekorzystanie)
  • Odtwarzaj obraz programu BMM
  • Zamień program BMM

Ważne

Żądania poleceń zakłócających względem węzła płaszczyzny sterowania Kubernetes (KCP) są odrzucane, jeśli istnieje już inne polecenie akcji zakłócające działanie względem innego węzła KCP lub jeśli pełne KCP nie jest dostępne. Ta kontrola jest wykonywana w celu zachowania integralności wystąpienia Nexus i zapewnienia, że wiele węzłów KCP nie działa jednocześnie z powodu równoczesnych działań zakłócających działanie. Jeśli wiele węzłów przestanie działać, spowoduje to przerwanie progu kworum w dobrej kondycji płaszczyzny sterowania kubernetes.

Akcje pogrubione na powyższej liście są uznawane za destrukcyjne (wyłączenie zasilania, ponowne uruchomienie, odtworzenie obrazu, zastąpienie). Cordon bez ewakuacji nie jest uważany za destrukcyjny. Cordon z ewakuacją jest uważany za destrukcyjny.

Jak wspomniano w oświadczeniu przestrogi, uruchamianie działań na serwerach zarządzania, zwłaszcza węzłów KCP, powinno odbywać się tylko w konsultacji z personelem pomocy technicznej firmy Microsoft.

Wymagania wstępne

  1. Zainstaluj najnowszą wersję odpowiednich rozszerzeń interfejsu wiersza polecenia.
  2. Pobierz nazwę grupy zasobów programu BMM — nazwa zarządzanej grupy zasobów klastra (cluster_MRG).
  3. Pobierz nazwę maszyny bez systemu operacyjnego, która wymaga operacji zarządzania cyklem życia.
  4. Upewnij się, że docelowa maszyna poweredState bez systemu operacyjnego jest ustawiona na On i readyState ustawiona na True.
    1. To wymaganie wstępne nie ma zastosowania do start polecenia .

Wyłączanie programu BMM

To polecenie spowoduje power-off , że określony bareMetalMachineNameelement .

az networkcloud baremetalmachine power-off \
  --name "bareMetalMachineName"  \
  --resource-group "cluster_MRG"

Uruchamianie programu BMM

To polecenie spowoduje start , że określony bareMetalMachineNameelement .

az networkcloud baremetalmachine start \
  --name "bareMetalMachineName" \
  --resource-group "cluster_MRG"

Uruchom ponownie program BMM

To polecenie spowoduje restart , że określony bareMetalMachineNameelement .

az networkcloud baremetalmachine restart \
  --name "bareMetalMachineName" \
  --resource-group "cluster_MRG"

Tworzenie nieplanowalnego programu BMM (cordon)

Program BMM można cofnąć, wykonując cordon polecenie . Podczas wykonywania cordon polecenia obciążenia Operator Nexus nie są zaplanowane w programie BMM po ustawieniu cordonu; każda próba utworzenia obciążenia w programie cordoned BMM powoduje ustawienie obciążenia na pending stan. Istniejące obciążenia są nadal uruchamiane. Polecenie cordon obsługuje evacuate parametr z wartością domyślną False . Po wykonaniu cordon polecenia z wartością True parametru evacuate obciążenia uruchomione w programie BMM są stopped ustawione na pending stan BMM.

az networkcloud baremetalmachine cordon \
  --evacuate "True" \
  --name "bareMetalMachineName" \
  --resource-group "cluster_MRG"

Element evacuate "True" usuwa obciążenia z tego węzła, ale evacuate "False" uniemożliwia tylko planowanie nowych obciążeń.

Tworzenie programu BMM "schedulable" (uncordon)

Możesz utworzyć program BMM "schedulable" (dostępny do użycia), wykonując uncordon polecenie . Wszystkie obciążenia w pending stanie w programie BMM są restarted wtedy, gdy program BMM ma wartość uncordoned.

az networkcloud baremetalmachine uncordon \
  --name "bareMetalMachineName" \
  --resource-group "cluster_MRG"

Reimage a BMM

Wersję środowiska uruchomieniowego można przywrócić w programie BMM, wykonując reimage polecenie . Ten proces ponownie wdraża obraz środowiska uruchomieniowego w docelowym programie BMM i wykonuje kroki ponownego dołączenia klastra z tymi samymi identyfikatorami. Ta akcja nie ma wpływu na pliki obciążeń dzierżawy w tym programie BMM. W przypadku wykonywania akcji zapisu lub edycji w węźle za pośrednictwem dostępu BMM ta akcja "reimage" jest wymagana do przywrócenia pomocy technicznej firmy Microsoft, a zmiany zostaną utracone, przywracając węzeł do oczekiwanego stanu. Najlepszym rozwiązaniem jest upewnienie się, że obciążenia programu BMM są opróżniane przy użyciu cordon polecenia z evacuate "True"poleceniem , przed wykonaniem reimage polecenia .

Ostrzeżenie

Uruchomienie więcej niż jednego baremetalmachine replace polecenia lub reimage w tym samym czasie lub uruchomienie replace elementu w tym samym czasie, co spowoduje reimage pozostawienie serwerów w stanie braku pracy. Przed rozpoczęciem drugiego upewnij się, że jeden replace/reimage został w pełni ukończony.

az networkcloud baremetalmachine reimage \
  –-name "bareMetalMachineName"  \
  --resource-group "cluster_MRG"

Zamień program BMM

replace Użyj polecenia , gdy serwer napotka problemy sprzętowe wymagające całkowitego lub częściowego zastąpienia sprzętu. Po zamianie składników, takich jak płyta główna lub karta sieciowa (NIC), adres MAC programu BMM zmieni się, jednak adres IP i nazwa hosta iDRAC pozostaną takie same.

Ostrzeżenie

Uruchomienie więcej niż jednego baremetalmachine replace polecenia lub reimage w tym samym czasie lub uruchomienie replace elementu w tym samym czasie, co spowoduje reimage pozostawienie serwerów w stanie braku pracy. Przed rozpoczęciem drugiego upewnij się, że jeden replace/reimage został w pełni ukończony.

az networkcloud baremetalmachine replace \
  --name "bareMetalMachineName" \
  --resource-group "cluster_MRG" \
  --bmc-credentials password="{password}" username="{user}" \
  --bmc-mac-address "00:00:4f:00:57:ad" \
  --boot-mac-address "00:00:4e:00:58:af" \
  --machine-name "OS_hostname" \
  --serial-number "BM1219XXX"