Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
In dit artikel wordt beschreven hoe u levenscyclusbeheerbewerkingen uitvoert op Bare Metal Machines (BMM). Deze stappen moeten worden gebruikt voor het oplossen van problemen om te herstellen van fouten of bij het uitvoeren van onderhoudsacties.
Lees eerst het advies in het artikel Beste praktijken voor bare-metal machinebewerkingen voordat u verdergaat met de bewerkingen.
De vetgedrukte acties die worden vermeld, worden beschouwd als verstorend (Uitschakelen, Opnieuw opstarten, Herinstalleren, Vervangen).
De Cordon-actie zonder de evacuate
parameter wordt niet als storend beschouwd, terwijl Cordon met de evacuate
parameter wordt beschouwd als verstorend.
- Een Bare Metal Machine uitschakelen
- Een Bare Metal Machine starten
- Een Bare Metal Machine opnieuw opstarten
- Maak een Bare Metal Machine onschafbaar (cordon zonder evacuaat, maakt het knooppunt niet leeg)
- Maak een Bare Metal Machine onscheduleerbaar (cordon met evacuatie, leegt het knooppunt)
- Maak een Bare Metal Machine planbaar (deblokkeer)
- Een Bare Metal Machine opnieuw installeren
- Een Bare Metal Machine vervangen
Let op
Voer geen actie uit tegen besturings- of beheervlakservers zonder eerst contact op te nemen met het ondersteuningspersoneel van Microsoft. Dit kan gevolgen hebben voor de integriteit van het Operator Nexus-cluster.
Belangrijk
Meerdere verstorende opdrachtaanvragen voor een KCP-knooppunt (Kubernetes Control Plane) worden geweigerd. Deze controle wordt uitgevoerd om de integriteit van het Nexus-clusterexemplaren te behouden en om te voorkomen dat meerdere KCP-knooppunten in één keer onoperationeel worden vanwege gelijktijdige verstorende acties. Geweigerde actieopdrachten kunnen worden veroorzaakt doordat ze al worden uitgevoerd op een ander KCP-knooppunt of als het volledige KCP niet beschikbaar is. Als meerdere knooppunten niet operationeel worden, wordt de drempelwaarde voor het quorum van het Kubernetes-besturingsvlak verbroken.
De vermelde acties worden beschouwd als verstorend voor BareMetal Machines (BMM):
- Een BMM uitschakelen
- Een BMM opnieuw starten
- Maak een BMM onopgeschikbaar (cordon met evacuaat, afvoert het knooppunt)
- Een BMM opnieuw installeren
- Een BMM vervangen
Alleen de niet-verstorende acties blijven over.
- Een BMM starten
- Maak een BMM onopgeschikbaar (cordon zonder evacuaat, maakt geen knooppunt leeg)
- Maak een BMM planbaar (deblokkeren)
Vereisten
- Installeer de nieuwste versie van de juiste CLI-extensies.
- Vraag toegang tot het uitvoeren van de Azure Operator Nexus-netwerkinfrastructuur (NF) en opdrachten voor de CLI-extensie voor de netwerkcloud.
- Meld u aan bij de Azure CLI en selecteer het abonnement waarin het cluster is geïmplementeerd.
- Verzamel de volgende informatie:
- Abonnement-ID (
SUBSCRIPTION
) - Clusternaam (
CLUSTER
) - Resourcegroep (
CLUSTER_RG
) - Beheerde resourcegroep (
CLUSTER_MRG
) - BareMetal Machines (BMM)-resources zijn aanwezig in de beheerde resourcegroep - BareMetal Machine Name (
BMM_NAME
) waarvoor levenscyclusbeheer vereist is
- Abonnement-ID (
Een Bare Metal Machine uitschakelen
Belangrijk
Er zijn zeldzame gevallen waarbij het uitvoeren van Nexus-VM's niet opnieuw kan worden gestart nadat BMM is afgesloten of opnieuw is opgestart. Als u deze gevallen wilt voorkomen, schakelt u alle virtuele machines op de BMM uit voordat u de BMM uitschakelt of opnieuw start. Zie de cordon
opdracht voor instructies voor het vinden van de workloads die worden uitgevoerd op een BMM.
Met deze opdracht wordt power-off
de opgegeven bareMetalMachineName
.
az networkcloud baremetalmachine power-off \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Een Bare Metal Machine starten
Met deze opdracht wordt start
de opgegeven bareMetalMachineName
.
az networkcloud baremetalmachine start \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Een Bare Metal Machine opnieuw opstarten
Belangrijk
Er zijn zeldzame gevallen waarbij het uitvoeren van Nexus-VM's niet opnieuw kan worden gestart nadat BMM is afgesloten of opnieuw is opgestart. Als u deze gevallen wilt voorkomen, schakelt u alle virtuele machines op de BMM uit voordat u de BMM uitschakelt of opnieuw start. Zie de cordon
opdracht voor instructies voor het vinden van de workloads die worden uitgevoerd op een BMM.
Met deze opdracht wordt restart
de opgegeven bareMetalMachineName
.
az networkcloud baremetalmachine restart \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Een Bare Metal Machine onschedulbaar maken (cordon)
U kunt een Bare Metal Machine onscheduleerbaar maken door de opdracht cordon
uit te voeren.
Bij het uitvoeren van het cordon
-commando worden Operator Nexus-workloads niet ingeroosterd op de Bare Metal Machine wanneer cordon
is ingeschakeld.
Elke poging om een werklast te maken op een cordoned
Bare Metal Machine resulteert in de werklast die wordt gezet naar pending
staat.
Bestaande werkbelastingen blijven draaien op de Bare Metal Machine, tenzij de werkbelastingen gedraineerd worden.
Taken taken bij Bare Metal Machine ontlasten
De cordon-opdracht ondersteunt de evacuate
parameter die de standaardwaarde False
betekent dat de cordon
opdracht voorkomt dat nieuwe workloads worden gepland.
Als u workloads met de cordon
opdracht wilt leegmaken, moet de evacuate
parameter worden ingesteld op True
.
De workloads die worden uitgevoerd op de Bare Metal Machine zijn stopped
en de Bare Metal Machine is ingesteld op pending
status.
Opmerking
Nexus Management Workloads blijven actief op de Bare Metal Machine, zelfs wanneer de server is vastgezet en geëvacueerd.
Het is een beste praktijk om de evacuate
-waarde in te stellen op True
bij het uitvoeren van onderhoudswerkzaamheden op de Bare Metal-server.
Lees voor meer best practices de Best Practices voor Bare Metal Machine-bewerkingen door.
az networkcloud baremetalmachine cordon \
--evacuate "True" \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Voer de volgende opdracht uit om te bepalen of er momenteel workloads worden uitgevoerd op een Bare Metal-machine:
Voor virtuele machines:
az networkcloud baremetalmachine show -n <nodeName> /
--resource-group <resourceGroup> /
--subscription <subscriptionID> | jq '.virtualMachinesAssociatedIds'
Voor Nexus Kubernetes-clusterknooppunten: (Hiervoor moet u zich aanmelden bij het Nexus Kubernetes-cluster)
kubectl get nodes <resourceName> -ojson |jq '.metadata.labels."topology.kubernetes.io/baremetalmachine"'
Maak een Bare Metal Machine planbaar (deblokkeer)
U kunt een Bare Metal Machine 'schedulable' maken (de server kan workloads hosten) door de uncordon
opdracht uit te voeren.
Alle werkbelastingen met de status pending
op de Bare Metal Machine worden restarted
wanneer de Bare Metal Machine uncordoned
is.
az networkcloud baremetalmachine uncordon \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Een Bare Metal Machine opnieuw configureren
U kunt de runtimeversie op een Bare Metal Machine herstellen door de opdracht uit te reimage
voeren. De reimage
actie heeft geen invloed op de tenantworkloadbestanden op de Bare Metal Machine.
Met dit proces wordt de runtime-image op de doel-Bare Metal Machine herplaatst en worden de stappen uitgevoerd om opnieuw deel te nemen aan het cluster met dezelfde identificatoren.
Als best practice moet u ervoor zorgen dat de werkbelastingen van de Bare Metal Machine worden leeggemaakt met de cordon
opdracht, waarbij evacuate
is ingesteld op True
, voordat u de reimage
opdracht uitvoert.
Lees voor meer best practices de Best Practices voor Bare Metal Machine-bewerkingen door.
Belangrijk
Vermijd schrijf- of bewerkingsacties die op het knooppunt worden uitgevoerd via Bare Metal Machine-toegang.
De reimage
actie is vereist voor het herstellen van Microsoft-ondersteuning en eventuele wijzigingen die zijn uitgevoerd op de Bare Metal Machine gaan verloren tijdens het herstellen van het knooppunt naar de verwachte status.
Waarschuwing
Voer niet meer dan één baremetalmachine replace
opdracht reimage
tegelijk uit voor dezelfde BareMetal Machine-resource (BMM).
Het gelijktijdig uitvoeren van replace
en een reimage
laat servers in een niet-operationele staat achter.
Zorg ervoor dat elk replace
/reimage
op de BMM volledig is voltooid voordat u aan een andere begint.
Vermijd bovendien het uitvoeren van sequentiële reimage
acties op een BMM die zojuist een replace
actie heeft voltooid, tenzij de opgegeven onderhoudsbewerking wordt uitgevoerd.
az networkcloud baremetalmachine reimage \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Een Bare Metal Machine vervangen
Gebruik de replace
opdracht wanneer een server hardwareproblemen ondervindt waarvoor een volledige of gedeeltelijke hardwarevervanging is vereist.
Nadat de vervangende onderdelen zoals moederbord of netwerkinterfacekaart (NIC) zijn vervangen, verandert het MAC-adres van Bare Metal Machine; het iDRAC-IP-adres en de hostnaam blijven echter hetzelfde.
Er moet een replace
controle worden uitgevoerd na elke hardwareonderhoudsbewerking, lees Best Practices voor het vervangen van een Bare Metal Machine voor meer informatie.
Vanaf de release 2506.2 kan de wachtwoordwaarde voor iDRAC worden opgegeven als een URI (Uniform Resource Identifier) of wachtwoordwaarde van Key Vault. Zie Key Vault-referentiehandleiding. Het gebruik van een URI in plaats van een wachtwoord zonder opmaak biedt extra beveiliging.
Waarschuwing
Voer niet meer dan één baremetalmachine replace
opdracht reimage
tegelijk uit voor dezelfde BareMetal Machine-resource (BMM).
Het gelijktijdig uitvoeren van replace
en een reimage
laat servers in een niet-operationele staat achter.
Zorg ervoor dat elk replace
/reimage
op de BMM volledig is voltooid voordat u aan een andere begint.
Vermijd bovendien het uitvoeren van sequentiële reimage
acties op een BMM die zojuist een replace
actie heeft voltooid, tenzij de opgegeven onderhoudsbewerking wordt uitgevoerd.
az networkcloud baremetalmachine replace \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--bmc-credentials password=<PASSWORD_URI or IDRAC_PASSWORD> username=<IDRAC_USER> \
--bmc-mac-address <IDRAC_MAC> \
--boot-mac-address <PXE_MAC> \
--machine-name <OS_HOSTNAME> \
--serial-number <SERIAL_NUMBER> \
--subscription <subscriptionID>
Als de replace
actie mislukt vanwege een hardwarevalidatiefout, wordt de specifieke fout of testfout weergegeven in het replace
antwoord, zoals wordt weergegeven in de volgende voorbeelden.
Deze informatie vindt u ook in het activiteitenlogboek voor de Bare Metal Machine (Operator Nexus).
De foutcode en het foutbericht bevatten de JSON-eigenschappen van de bijbehorende BareMetalMachines_Replace
bewerking.
Voorbeeld 1: Hardwarevalidatie mislukt vanwege ongeldige Key Vault-URI voor BMC-referenties (Baseboard Management Controller)
$ az networkcloud baremetalmachine replace --name rack1compute02 --resource-group hostedRG --bmc-credentials password=$KEY_VAULT_URI username=root --bmc-mac-address 00-00-5E-00-01-00 --boot-mac-address 00-00-5E-00-02-00 --machine-name RACK1COMPUTE02 --serial-number SN123435
(failed to retrieve password from key vault) failed to get secret value from key vault: failed to get cluster key vault secret
Code: failed to retrieve password from key vault
Message: failed to retrieve password from key vault
Response: 400 Bad Request
Voorbeeld 2: Hardwarevalidatie mislukt vanwege ongeldige BMC-referenties (Baseboard Management Controller)
$ az networkcloud baremetalmachine replace --name rack1compute02 --resource-group hostedRG --bmc-credentials password=REDACTED username=root --bmc-mac-address 00-00-5E-00-01-00 --boot-mac-address 00-00-5E-00-02-00 --machine-name RACK1COMPUTE02 --serial-number SN123435
(None) BMC login unsuccessful: Fail - Unauthorized; System health test(s) failed: [Additional logs: Server power down at end of test failed with: Unauthorized]
Code: None
Message: BMC login unsuccessful: Fail - Unauthorized; System health test(s) failed: [Additional logs: Server power down at end of test failed with: Unauthorized]
Voorbeeld 3: Hardwarevalidatie mislukt vanwege netwerkfouten
$ az networkcloud baremetalmachine replace --name rack1compute02 --resource-group hostedRG --bmc-credentials password=REDACTED username=root --bmc-mac-address 00-00-5E-00-01-00 --boot-mac-address 00-00-5E-00-02-00 --machine-name RACK1COMPUTE02 --serial-number SN123435
(None) Networking test(s) failed: [NIC.Slot.6-1-1_LinkStatus] expected: up; observed: Down; [Additional logs: Link failure detected on NIC.Slot.6-1-1; Unable to perform cabling check on PCI Slot 6]
Code: None
Message: Networking test(s) failed: [NIC.Slot.6-1-1_LinkStatus] expected: up; observed: Down; [Additional logs: Link failure detected on NIC.Slot.6-1-1; Unable to perform cabling check on PCI Slot 6]
Zie Problemen met hardwarevalidatie oplossenvoor meer informatie over het oplossen van hardwarevalidatiefouten.