Zarządzanie cyklem życia maszyn bez systemu operacyjnego
W tym artykule opisano sposób wykonywania operacji zarządzania cyklem życia na maszynach bez systemu operacyjnego (BMM). Te kroki powinny być używane do rozwiązywania problemów w celu odzyskania sprawności po awarii lub podczas wykonywania akcji konserwacji. Polecenia do zarządzania cyklem życia programu BMM obejmują:
Uwaga
Nie wykonuj żadnych działań na serwerach zarządzania bez uprzedniej konsultacji z personelem pomocy technicznej firmy Microsoft. Może to mieć wpływ na integralność klastra Operator Nexus.
- Wyłączanie programu BMM
- Uruchamianie programu BMM
- Uruchom ponownie program BMM
- Nie można anulować programu BMM (kordon bez ewakuacji)
- Nie można anulować programu BMM (kordon z ewakuacją)
- Uchwalenie programu BMM (niekorzystanie)
- Odtwarzaj obraz programu BMM
- Zamień program BMM
Ważne
Żądania poleceń zakłócających względem węzła płaszczyzny sterowania Kubernetes (KCP) są odrzucane, jeśli istnieje już inne polecenie akcji zakłócające działanie względem innego węzła KCP lub jeśli pełne KCP nie jest dostępne. Ta kontrola jest wykonywana w celu zachowania integralności wystąpienia Nexus i zapewnienia, że wiele węzłów KCP nie działa jednocześnie z powodu równoczesnych działań zakłócających działanie. Jeśli wiele węzłów przestanie działać, spowoduje to przerwanie progu kworum w dobrej kondycji płaszczyzny sterowania kubernetes.
Akcje pogrubione na powyższej liście są uznawane za destrukcyjne (wyłączenie zasilania, ponowne uruchomienie, odtworzenie obrazu, zastąpienie). Cordon bez ewakuacji nie jest uważany za destrukcyjny. Cordon z ewakuacją jest uważany za destrukcyjny.
Jak wspomniano w oświadczeniu przestrogi, uruchamianie działań na serwerach zarządzania, zwłaszcza węzłów KCP, powinno odbywać się tylko w konsultacji z personelem pomocy technicznej firmy Microsoft.
Wymagania wstępne
- Zainstaluj najnowszą wersję odpowiednich rozszerzeń interfejsu wiersza polecenia.
- Pobierz nazwę grupy zasobów programu BMM — nazwa zarządzanej grupy zasobów klastra (cluster_MRG).
- Pobierz nazwę maszyny bez systemu operacyjnego, która wymaga operacji zarządzania cyklem życia.
- Upewnij się, że docelowa maszyna
poweredState
bez systemu operacyjnego jest ustawiona naOn
ireadyState
ustawiona naTrue
.- To wymaganie wstępne nie ma zastosowania do
start
polecenia .
- To wymaganie wstępne nie ma zastosowania do
Wyłączanie programu BMM
To polecenie spowoduje power-off
, że określony bareMetalMachineName
element .
az networkcloud baremetalmachine power-off \
--name "bareMetalMachineName" \
--resource-group "cluster_MRG"
Uruchamianie programu BMM
To polecenie spowoduje start
, że określony bareMetalMachineName
element .
az networkcloud baremetalmachine start \
--name "bareMetalMachineName" \
--resource-group "cluster_MRG"
Uruchom ponownie program BMM
To polecenie spowoduje restart
, że określony bareMetalMachineName
element .
az networkcloud baremetalmachine restart \
--name "bareMetalMachineName" \
--resource-group "cluster_MRG"
Tworzenie nieplanowalnego programu BMM (cordon)
Program BMM można cofnąć, wykonując cordon
polecenie .
Podczas wykonywania cordon
polecenia obciążenia Operator Nexus nie są zaplanowane w programie BMM po ustawieniu cordonu; każda próba utworzenia obciążenia w programie cordoned
BMM powoduje ustawienie obciążenia na pending
stan. Istniejące obciążenia są nadal uruchamiane.
Polecenie cordon obsługuje evacuate
parametr z wartością domyślną False
.
Po wykonaniu cordon
polecenia z wartością True
parametru evacuate
obciążenia uruchomione w programie BMM są stopped
ustawione na pending
stan BMM.
az networkcloud baremetalmachine cordon \
--evacuate "True" \
--name "bareMetalMachineName" \
--resource-group "cluster_MRG"
Element evacuate "True"
usuwa obciążenia z tego węzła, ale evacuate "False"
uniemożliwia tylko planowanie nowych obciążeń.
Tworzenie programu BMM "schedulable" (uncordon)
Możesz utworzyć program BMM "schedulable" (dostępny do użycia), wykonując uncordon
polecenie . Wszystkie obciążenia w pending
stanie w programie BMM są restarted
wtedy, gdy program BMM ma wartość uncordoned
.
az networkcloud baremetalmachine uncordon \
--name "bareMetalMachineName" \
--resource-group "cluster_MRG"
Reimage a BMM
Wersję środowiska uruchomieniowego można przywrócić w programie BMM, wykonując reimage
polecenie . Ten proces ponownie wdraża obraz środowiska uruchomieniowego w docelowym programie BMM i wykonuje kroki ponownego dołączenia klastra z tymi samymi identyfikatorami. Ta akcja nie ma wpływu na pliki obciążeń dzierżawy w tym programie BMM. W przypadku wykonywania akcji zapisu lub edycji w węźle za pośrednictwem dostępu BMM ta akcja "reimage" jest wymagana do przywrócenia pomocy technicznej firmy Microsoft, a zmiany zostaną utracone, przywracając węzeł do oczekiwanego stanu.
Najlepszym rozwiązaniem jest upewnienie się, że obciążenia programu BMM są opróżniane przy użyciu cordon
polecenia z evacuate "True"
poleceniem , przed wykonaniem reimage
polecenia .
Ostrzeżenie
Uruchomienie więcej niż jednego baremetalmachine replace
polecenia lub reimage
w tym samym czasie lub uruchomienie replace
elementu w tym samym czasie, co spowoduje reimage
pozostawienie serwerów w stanie braku pracy. Przed rozpoczęciem drugiego upewnij się, że jeden replace
/reimage
został w pełni ukończony.
az networkcloud baremetalmachine reimage \
–-name "bareMetalMachineName" \
--resource-group "cluster_MRG"
Zamień program BMM
replace
Użyj polecenia , gdy serwer napotka problemy sprzętowe wymagające całkowitego lub częściowego zastąpienia sprzętu. Po zamianie składników, takich jak płyta główna lub karta sieciowa (NIC), adres MAC programu BMM zmieni się, jednak adres IP i nazwa hosta iDRAC pozostaną takie same.
Ostrzeżenie
Uruchomienie więcej niż jednego baremetalmachine replace
polecenia lub reimage
w tym samym czasie lub uruchomienie replace
elementu w tym samym czasie, co spowoduje reimage
pozostawienie serwerów w stanie braku pracy. Przed rozpoczęciem drugiego upewnij się, że jeden replace
/reimage
został w pełni ukończony.
az networkcloud baremetalmachine replace \
--name "bareMetalMachineName" \
--resource-group "cluster_MRG" \
--bmc-credentials password="{password}" username="{user}" \
--bmc-mac-address "00:00:4f:00:57:ad" \
--boot-mac-address "00:00:4e:00:58:af" \
--machine-name "OS_hostname" \
--serial-number "BM1219XXX"