Dela via


Bare Metal Machine Platform-kommandon

Den här artikeln beskriver hur du utför livscykelhanteringsåtgärder på Bare Metal Machines (BMM). De här stegen bör användas för felsökning för att återställa från fel eller vid underhållsåtgärder.

Läs först råden i artikeln Best Practices for Bare Metal Machine Operations (Bästa praxis för bare metal-maskinoperationer) innan du går vidare med åtgärderna.

De fetstilta åtgärderna i listan anses vara störande (strömavbrott, omstart, återstart, ersätt). Cordon-åtgärden utan parametern evacuate anses inte vara störande medan Cordon med parametern evacuate anses vara störande.

  • Stäng av en fysisk metallmaskin
  • Starta en bare metal-maskin
  • Starta om en Bare Metal-dator
  • Gör en bare metal-maskin inte schemaläggningsbar (blockering utan evakuering, tömmer inte noden)
  • Gör en bare metal-maskin oplanerbar (cordon och evakuera, tömmer noden)
  • Gör en bare metal-maskin schemaläggningsbar (ta bort blockeringen)
  • Återskapa en bare metal-maskin
  • Ersätt en fysisk bare metal-maskin

Varning

Utför ingen åtgärd mot kontroll- eller hanteringsplanservrar utan att först kontakta Microsofts supportpersonal, vilket kan påverka integriteten för Operator Nexus-klustret.

Viktigt!

Flera störande kommandobegäranden mot en Kubernetes Control Plane-nod (KCP) avvisas. Den här kontrollen görs för att upprätthålla integriteten för Nexus-klusterinstansen och undvika att flera KCP-noder blir icke-operativa samtidigt på grund av samtidiga störande åtgärder. Avvisade avbrottsåtgärdskommandon kan bero på att de redan körs mot en annan KCP-nod eller för att den fullständiga KCP inte är tillgänglig. Om flera noder blir icke-operativa bryter det det hälsosamma kvorumtröskeln för Kubernetes-kontrollplanet.

De åtgärder som anges anses vara störande för BareMetal Machines (BMM):

  • Stäng av en BMM
  • Starta om en BMM
  • Gör en BMM icke-schemaläggbar (avspärrning med evakuering, tömmer noden)
  • Ombilda en BMM
  • Ersätt en BMM

Återstår endast de ostörande åtgärderna.

  • Starta en BMM
  • Gör en BMM icke-schemaläggbar (avspärrning utan utrymning, tömmer inte noden)
  • Gör en BMM-schemaläggningsbar (uncordon)

Förutsättningar

  1. Installera den senaste versionen av lämpliga CLI-tillägg.
  2. Begär åtkomst för att köra Azure Operator Nexus-nätverksinfrastrukturen (NF) och cli-tilläggskommandona för nätverksmoln.
  3. Logga in på Azure CLI och välj den prenumeration där klustret distribueras.
  4. Samla in följande information:
    • Prenumerations-ID (SUBSCRIPTION)
    • Klusternamn (CLUSTER)
    • Resursgrupp (CLUSTER_RG)
    • Hanterad resursgrupp (CLUSTER_MRG) – BareMetal Machines-resurser (BMM) finns i den hanterade resursgruppen
    • Namn på BareMetal-maskin (BMM_NAME) som kräver livscykelhanteringsåtgärder

Stäng av en bare metal-maskin

Viktigt!

Det finns sällsynta fall där det inte går att starta om virtuella Nexus-datorer efter BMM-avstängning eller omstart. För att förhindra dessa fall stänger du av alla virtuella datorer på BMM innan du stänger av eller startar om BMM. Mer information om hur du hittar arbetsbelastningar som körs på en BMM finns i cordon kommandot.

Det här kommandot kommer att power-off den angivna bareMetalMachineName.

az networkcloud baremetalmachine power-off \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

Starta en bare metal-maskin

Det här kommandot kommer att start den angivna bareMetalMachineName.

az networkcloud baremetalmachine start \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

Starta om en bare metal-maskin

Viktigt!

Det finns sällsynta fall där det inte går att starta om virtuella Nexus-datorer efter BMM-avstängning eller omstart. För att förhindra dessa fall stänger du av alla virtuella datorer på BMM innan du stänger av eller startar om BMM. Mer information om hur du hittar arbetsbelastningar som körs på en BMM finns i cordon kommandot.

Det här kommandot kommer att restart den angivna bareMetalMachineName.

az networkcloud baremetalmachine restart \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

Gör en bare metal-maskin oplanerbar (förhindra)

Du kan göra en bare metal-dator oplanerbar genom att köra kommandot cordon. Vid körningen av kommandot cordon schemaläggs inte Operator Nexus-arbetsbelastningar på bare metal-maskinen när cordon är inställt. Alla försök att skapa en arbetslast på en cordoned Bare Metal-maskin resulterar i att arbetslasten sätts i pending-tillstånd. Befintliga arbetsbelastningar fortsätter att köras på bare metal-datorn om inte arbetsbelastningarna töms.

Avveckla arbetsbelastningar för bare metal-maskiner

Kommandot cordon stöder parametern evacuate vilket standardvärdet False innebär att cordon kommandot förhindrar schemaläggning av nya arbetsbelastningar. Om du vill tömma arbetsbelastningar med cordon kommandot måste parametern evacuate vara inställd på True. De arbetsbelastningar som körs på bare metal-servern är stopped och bare metal-servern är inställd på pending läge.

Anmärkning

Nexus-hanteringsarbetsbelastningar fortsätter att köras på bare metal-datorn även när servern är avspärrad och evakuerad.

Det är en bra idé att ange evacuate värdet till True när du försöker utföra underhållsåtgärder på Bare Metal-servern. För fler bästa praxis att följa, läs Bästa praxis för bare metal-datoråtgärder.

az networkcloud baremetalmachine cordon \
  --evacuate "True" \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

Kör följande kommando för att identifiera om några arbetslaster körs på en Bare Metal-maskin:

För virtuella datorer:

az networkcloud baremetalmachine show -n <nodeName> /
  --resource-group <resourceGroup> /
  --subscription <subscriptionID> | jq '.virtualMachinesAssociatedIds'

För Nexus Kubernetes-klusternoder: (Kräver inloggning i Nexus Kubernetes-klustret)

kubectl get nodes <resourceName> -ojson |jq '.metadata.labels."topology.kubernetes.io/baremetalmachine"'

Gör en bare metal-maskin schemaläggningsbar (ta bort blockeringen)

Du kan göra en Bare Metal-maskin schemaläggningsbar (servern kan vara värd för arbetsbelastningar) genom att köra kommandot uncordon. Alla arbetsbelastningar i ett pending tillstånd på Bare Metal-maskinen är restarted när Bare Metal-maskinen är uncordoned.

az networkcloud baremetalmachine uncordon \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

Återinstallera en bare metal-maskin

Du kan återställa körningsversionen på en Bare Metal-maskin genom att köra kommandot reimage. Åtgärden reimage påverkar inte hyresgästens arbetsbelastningsfiler på bare metal-maskinen. Den här processen omdistribuerar körningsavbildningen på den fysiska målmaskinen och utför stegen för att återansluta till klustret med samma identifierare.

Vi rekommenderar att du ser till att Bare Metal-maskinens arbetslaster töms med kommandot cordon, med evacuate inställt på True, innan du kör kommandot reimage. För fler bästa praxis att följa, läs Bästa praxis för bare metal-datoråtgärder.

Viktigt!

Undvik skriv- eller redigeringsåtgärder som utförs på noden via åtkomst till Bare Metal Machine. Åtgärden reimage krävs för att återställa Microsofts support och alla ändringar som görs i bare metal-datorn går förlorade när noden återställs till det förväntade tillståndet.

Varning

Kör inte mer än ett baremetalmachine replace kommando eller reimage kommando samtidigt för samma BareMetal Machine-resurs (BMM). När replace körs samtidigt som en reimage blir servrarna obrukbara. Kontrollera att alla replace/reimage på BMM slutförs helt innan du påbörjar en annan. Undvik dessutom att utföra sekventiella reimage åtgärder på en BMM som just har slutfört en replace åtgärd om inte den angivna underhållsåtgärden utförs.

az networkcloud baremetalmachine reimage \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

Ersätt en "bare metal"-dator

replace Använd kommandot när en server stöter på maskinvaruproblem som kräver en fullständig eller partiell maskinvaruersättning. Efter bytet av komponenter som moderkort eller nätverkskort (NIC) ändras MAC-adressen för Bare Metal Machine. Ip-adressen och värdnamnet för iDRAC förblir dock desamma. Ett replacemåste utföras efter varje maskinvaruunderhållsåtgärd, läs igenom Metodtips för en Bare Metal Machine-ersättning för mer detaljer.

Från och med 2506.2-versionen kan lösenordsvärdet för iDRAC anges som ett URI (Key Vault Uniform Resource Identifier) eller lösenordsvärde. Se Referens för Key Vault-autentiseringsuppgifter. Att använda en URI i stället för ett lösenord i klartext ger extra säkerhet.

Varning

Kör inte mer än ett baremetalmachine replace kommando eller reimage kommando samtidigt för samma BareMetal Machine-resurs (BMM). När replace körs samtidigt som en reimage blir servrarna obrukbara. Kontrollera att alla replace/reimage på BMM slutförs helt innan du påbörjar en annan. Undvik dessutom att utföra sekventiella reimage åtgärder på en BMM som just har slutfört en replace åtgärd om inte den angivna underhållsåtgärden utförs.

az networkcloud baremetalmachine replace \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --bmc-credentials password=<PASSWORD_URI or IDRAC_PASSWORD> username=<IDRAC_USER> \
  --bmc-mac-address <IDRAC_MAC> \
  --boot-mac-address <PXE_MAC> \
  --machine-name <OS_HOSTNAME> \
  --serial-number <SERIAL_NUMBER> \
  --subscription <subscriptionID>

Om åtgärden replace misslyckas på grund av ett maskinvaruverifieringsfel visas det specifika felet eller testfelet replace i svaret, enligt följande exempel. Den här informationen finns också i aktivitetsloggen för bare metal-datorn (Operator Nexus). Felkoden och felmeddelandet inkluderas i JSON-egenskaperna i motsvarande BareMetalMachines_Replace operation.

Exempel 1: Maskinvaruverifieringen misslyckas på grund av ogiltig Key Vault-URI för BMC-autentiseringsuppgifter (Baseboard Management Controller)

$ az networkcloud baremetalmachine replace --name rack1compute02 --resource-group hostedRG --bmc-credentials password=$KEY_VAULT_URI username=root --bmc-mac-address 00-00-5E-00-01-00 --boot-mac-address 00-00-5E-00-02-00 --machine-name RACK1COMPUTE02 --serial-number SN123435
(failed to retrieve password from key vault) failed to get secret value from key vault: failed to get cluster key vault secret
Code: failed to retrieve password from key vault
Message: failed to retrieve password from key vault
Response: 400 Bad Request

Exempel 2: Maskinvaruverifieringen misslyckas på grund av ogiltiga BMC-autentiseringsuppgifter (Baseboard Management Controller)

$ az networkcloud baremetalmachine replace --name rack1compute02 --resource-group hostedRG --bmc-credentials password=REDACTED username=root --bmc-mac-address 00-00-5E-00-01-00 --boot-mac-address 00-00-5E-00-02-00 --machine-name RACK1COMPUTE02 --serial-number SN123435
(None) BMC login unsuccessful: Fail - Unauthorized; System health test(s) failed: [Additional logs: Server power down at end of test failed with: Unauthorized]
Code: None
Message: BMC login unsuccessful: Fail - Unauthorized; System health test(s) failed: [Additional logs: Server power down at end of test failed with: Unauthorized]

Exempel 3: Maskinvaruverifieringen misslyckas på grund av nätverksfel

$ az networkcloud baremetalmachine replace --name rack1compute02 --resource-group hostedRG --bmc-credentials password=REDACTED username=root --bmc-mac-address 00-00-5E-00-01-00 --boot-mac-address 00-00-5E-00-02-00 --machine-name RACK1COMPUTE02 --serial-number SN123435
(None) Networking test(s) failed: [NIC.Slot.6-1-1_LinkStatus] expected: up; observed: Down; [Additional logs: Link failure detected on NIC.Slot.6-1-1; Unable to perform cabling check on PCI Slot 6]
Code: None
Message: Networking test(s) failed: [NIC.Slot.6-1-1_LinkStatus] expected: up; observed: Down; [Additional logs: Link failure detected on NIC.Slot.6-1-1; Unable to perform cabling check on PCI Slot 6]

Mer information om hur du felsöker maskinvaruvalideringsfel finns i Felsöka maskinvaruverifieringsfel.