Aracılığıyla paylaş


Çıplak Metal Makine Platformu Komutları

Bu makalede, Çıplak Makinelerde (BMM) yaşam döngüsü yönetimi işlemlerinin nasıl gerçekleştirildiği açıklanmaktadır. Bu adımlar, hatalardan kurtarmak veya bakım eylemleri gerçekleştirirken sorun giderme amacıyla kullanılmalıdır.

İlk olarak, işlemlere devam etmeden önce Çıplak Makine İşlemleri için En İyi Yöntemler makalesindeki önerileri okuyun.

Listelenen kalın eylemler kesinti olarak değerlendirilir (Kapatma, Yeniden Başlatma, Yeniden İmajlama, Değiştir). Parametresi olmayan evacuate Cordon eylemi kesintiye neden olarak kabul edilmezken, parametreli evacuate Cordon kesintiye neden olur.

  • Çıplak Metal Makineyi Kapatma
  • Çıplak Metal Makine Başlat
  • Çıplak Metal Makineyi Yeniden Başlat
  • Çıplak Makine'yi zamanlanamaz hale getirin (boşaltma olmadan kordon, düğümü boşaltmaz)
  • Çıplak Metal Makineyi zamanlanamaz hale getirin (tahliye ile kordon, düğümü boşaltıyor)
  • Fiziksel Makineyi zamanlanabilir hale getirme (erişim kısıtlamasını kaldırma)
  • Çıplak Metal Makineyi Yeniden İmajlandırma
  • Çıplak Makine Değiştirme

Dikkat

İlk olarak Microsoft destek personeline danışmadan denetim veya yönetim düzlemi sunucularına karşı herhangi bir işlem yapmayın; bunu yapmak Operatör Nexus Kümesinin bütünlüğünü etkileyebilir.

Önemli

Kubernetes Denetim Düzlemi (KCP) düğümüne yönelik birden çok kesintiye neden olan komut isteği reddedilir. Bu denetim, Nexus Kümesi örneğinin bütünlüğünü korumak ve eşzamanlı kesintiye neden olan eylemler nedeniyle birden çok KCP düğümünün aynı anda çalışmamasını önlemek için yapılır. Reddedilen kesintili eylem komutları, ya başka bir KCP düğümüne karşı zaten çalışıyor olabilir ya da tüm KCP'nin kullanılabilir olmamasından kaynaklanabilir. Birden çok düğüm çalışma dışı hale gelirse Kubernetes Denetim Düzlemi'nin sağlıklı çoğunluk eşiğini kırar.

Listelenen eylemler, BareMetal Machines (BMM) için kesintiye neden olabilir:

  • BMM'yi kapatma
  • BMM'yi yeniden başlatma
  • BMM'yi planlanamaz hale getirin (kordon ile boşaltma, düğümü tahliye eder)
  • BMM'nin imajını yeniden yükleme
  • BMM'yi değiştirme

Yalnızca kesintisiz eylemleri bırakmak:

  • BMM başlat
  • BMM'yi zamanlanamaz hale getirin (tahliye olmadan kordon, düğümü boşaltmaz)
  • BMM'yi zamanlanabilir yapmak için engeli kaldırma

Önkoşullar

  1. Uygun CLI uzantılarının en son sürümünü yükleyin.
  2. Azure Operatör Nexus ağ dokusu (NF) ve ağ bulut CLI uzantısı komutlarını çalıştırmak için erişim isteyin.
  3. Azure CLI'da oturum açın ve kümenin dağıtıldığı aboneliği seçin.
  4. Aşağıdaki bilgileri toplayın:
    • Abonelik Kimliği (SUBSCRIPTION)
    • Küme adı (CLUSTER)
    • Kaynak grubu (CLUSTER_RG)
    • Yönetilen kaynak grubu (CLUSTER_MRG) - Yönetilen kaynak grubunda BareMetal Machines (BMM) kaynakları bulunur
    • Yaşam döngüsü yönetimi işlemleri gerektiren Bare Metal Makine Adı (BMM_NAME)

Bare Metal Sunucuyu Kapatma

Önemli

BMM kapatıldıktan veya yeniden başlatıldıktan sonra Nexus VM'lerinin yeniden başlatılamadığı nadir durumlar vardır. Bu durumları önlemek için BMM'yi kapatmadan veya yeniden başlatmadan önce BMM üzerindeki tüm sanal makineleri kapatın. cordon komutunu, BMM üzerinde çalışan iş yüklerini bulma talimatları için inceleyin.

Bu komut power-off , belirtilen bareMetalMachineNameolacaktır.

az networkcloud baremetalmachine power-off \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

Çıplak Metal Makine Başlat

Bu komut start , belirtilen bareMetalMachineNameolacaktır.

az networkcloud baremetalmachine start \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

Çıplak Makineyi Yeniden Başlatma

Önemli

BMM kapatıldıktan veya yeniden başlatıldıktan sonra Nexus VM'lerinin yeniden başlatılamadığı nadir durumlar vardır. Bu durumları önlemek için BMM'yi kapatmadan veya yeniden başlatmadan önce BMM üzerindeki tüm sanal makineleri kapatın. cordon komutunu, BMM üzerinde çalışan iş yüklerini bulma talimatları için inceleyin.

Bu komut restart , belirtilen bareMetalMachineNameolacaktır.

az networkcloud baremetalmachine restart \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

Bare Metal Makineyi zamanlanamaz olarak işaretleme (kordon)

Komutunu yürüterek cordon Çıplak Metal Makine'yi zamanlanamaz hale getirebilirsiniz. Komut çalıştırıldığında, cordon ayarlandığında Operatör Nexus iş yükleri Çıplak Metal Makine üzerinde zamanlanmaz. Çıplak Metal Makinesi üzerinde herhangi bir iş yükü oluşturma girişimi, iş yükünün cordoned durumuna ayarlanmasına neden olur. İş yükleri boşaltılmadığı sürece, mevcut iş yükleri Çıplak Metal Makine üzerinde çalışmaya devam eder.

Çıplak Metal Makine iş yüklerini boşalt

cordon komutu, varsayılan değeri evacuate olan ve False komutunun yeni iş yüklerinin zamanlanmasını engellediği anlamına gelen cordon parametresini destekler. cordon komutuyla iş yüklerini boşaltmak için evacuate parametresinin True olarak ayarlanması gerekmektedir. Bare Metal Makine'de çalışan iş yükleri şunlardır stopped ve Bare Metal Makine pending durumuna ayarlanır.

Uyarı

Sunucu kordon altına alınıp boşaltıldığında bile Nexus Yönetim İş Yükleri Çıplak Makinede çalışmaya devam eder.

Bare Metal sunucusunda herhangi bir bakım işlemi gerçekleştirmeye çalışırken evacuate değerini True olarak ayarlamak en iyi uygulamadır. Daha fazla en iyi uygulama için Çıplak Metal Makine İşlemleri için En İyi Uygulamalar'ı okuyun.

az networkcloud baremetalmachine cordon \
  --evacuate "True" \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

Bir Bare Metal Sunucuda şu anda çalışmakta olan iş yükü olup olmadığını belirlemek için aşağıdaki komutu çalıştırın:

Sanal Makineler için:

az networkcloud baremetalmachine show -n <nodeName> /
  --resource-group <resourceGroup> /
  --subscription <subscriptionID> | jq '.virtualMachinesAssociatedIds'

Nexus Kubernetes küme düğümleri için: (Nexus Kubernetes kümesinde oturum açmayı gerektirir)

kubectl get nodes <resourceName> -ojson |jq '.metadata.labels."topology.kubernetes.io/baremetalmachine"'

Fiziksel Makineyi zamanlanabilir hale getirme (erişim kısıtlamasını kaldırma)

Komutunu yürüterek uncordon, Çıplak Metal Makine'yi "zamanlanabilir" yapabilirsiniz (sunucu iş yüklerini barındırabilir). Bare Metal Makine'deki bir pending durumundaki tüm iş yükleri, Bare Metal Makine restarted olduğunda uncordoned.

az networkcloud baremetalmachine uncordon \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

Çıplak Metal Makineyi Yeniden İmajlama

reimage komutunu yürüterek bir Bare Metal Makinede çalışma zamanı sürümünü geri alabilirsiniz. Eylem, reimage Bare Metal Makine üzerindeki tenant iş yükü dosyalarını etkilemez. Bu işlem, çalışma zamanı görüntüsünü hedef Çıplak Metal Makinede yeniden dağıtır ve kümeye özdeş tanımlayıcılarla yeniden katılma adımlarını yürütür.

En iyi uygulama olarak, cordon komutunu yürütmeden önce Bare Metal Makine'nin iş yüklerinin evacuate komutunu kullanarak boşaltıldığından ve True'nin reimage olarak ayarlandığından emin olun. Daha fazla en iyi uygulama için Çıplak Metal Makine İşlemleri için En İyi Uygulamalar'ı okuyun.

Önemli

Çıplak Metal Makine erişimi aracılığıyla düğümde gerçekleştirilen yazma veya düzenleme işlemlerinden kaçının. Microsoft desteğini geri yüklemek için reimage eylemi gereklidir ve Bare Metal Makine üzerinde yapılan tüm değişiklikler, düğümü beklendiği duruma geri yüklerken kaybolur.

Uyarı

Aynı BareMetal Machine (BMM) kaynağı için aynı anda birden baremetalmachine replace fazla veya reimage komut çalıştırmayın. replace ve reimage aynı anda yürütülmesi, sunucuları çalışmaz durumda bırakır. BMM üzerinde herhangi bir replace/reimage'nin tamamen tamamlandığından emin olun ve başka bir tanesine başlamayın. Ayrıca, belirtilen bakım işlemi gerçekleştirilmediği sürece, yeni bir reimage eylemini tamamlamış bir BMM'de sıralı replace eylemler gerçekleştirmekten kaçının.

az networkcloud baremetalmachine reimage \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --subscription <subscriptionID>

Çıplak Metal Makine Değiştirme

replace Sunucu tam veya kısmi donanım değişimi gerektiren donanım sorunlarıyla karşılaştığında komutunu kullanın. Anakart veya Ağ Arabirim Kartı (NIC) gibi bileşenleri değiştirdikten sonra Çıplak Makine'nin MAC adresi değişir; ancak, iDRAC IP adresi ve ana bilgisayar adı aynı kalır. Bir replaceişlem, her donanım bakım işleminden sonra yürütülmelidir. Daha fazla ayrıntı için Bare Metal Makine değiştirme için en iyi yöntemler bölümünü okuyun.

2506.2 sürümünden itibaren iDRAC için parola değeri Key Vault Tekdüzen Kaynak Tanımlayıcısı (URI) veya parola değeri olarak sağlanabilir. Bkz. Key Vault Kimlik Bilgisi Başvurusu. Düz metin parola yerine URI kullanmak ek güvenlik sağlar.

Uyarı

Aynı BareMetal Machine (BMM) kaynağı için aynı anda birden baremetalmachine replace fazla veya reimage komut çalıştırmayın. replace ve reimage aynı anda yürütülmesi, sunucuları çalışmaz durumda bırakır. BMM üzerinde herhangi bir replace/reimage'nin tamamen tamamlandığından emin olun ve başka bir tanesine başlamayın. Ayrıca, belirtilen bakım işlemi gerçekleştirilmediği sürece, yeni bir reimage eylemini tamamlamış bir BMM'de sıralı replace eylemler gerçekleştirmekten kaçının.

az networkcloud baremetalmachine replace \
  --name <BareMetalMachineName> \
  --resource-group <resourceGroup> \
  --bmc-credentials password=<PASSWORD_URI or IDRAC_PASSWORD> username=<IDRAC_USER> \
  --bmc-mac-address <IDRAC_MAC> \
  --boot-mac-address <PXE_MAC> \
  --machine-name <OS_HOSTNAME> \
  --serial-number <SERIAL_NUMBER> \
  --subscription <subscriptionID>

replace Eylem bir donanım doğrulama hatası nedeniyle başarısız olursa, aşağıdaki örneklerde gösterildiği gibi yanıtta replace belirli bir hata veya test hatası gösterilir. Bu bilgiler Çıplak Metal Makine için Etkinlik Günlüğü'nde de bulunabilir (Operatör Nexus). Hata kodu ve hata iletisi, ilgili BareMetalMachines_Replace işlemin JSON özelliklerini içerir.

Örnek 1: Temel Kart Yönetim Denetleyicisi (BMC) kimlik bilgileri için geçersiz Key Vault URI'sine bağlı olarak donanım doğrulaması başarısız oluyor

$ az networkcloud baremetalmachine replace --name rack1compute02 --resource-group hostedRG --bmc-credentials password=$KEY_VAULT_URI username=root --bmc-mac-address 00-00-5E-00-01-00 --boot-mac-address 00-00-5E-00-02-00 --machine-name RACK1COMPUTE02 --serial-number SN123435
(failed to retrieve password from key vault) failed to get secret value from key vault: failed to get cluster key vault secret
Code: failed to retrieve password from key vault
Message: failed to retrieve password from key vault
Response: 400 Bad Request

Örnek 2: Donanım doğrulaması, sağlanan geçersiz Temel Kart Yönetim Denetleyicisi (BMC) kimlik bilgileri nedeniyle başarısız oluyor

$ az networkcloud baremetalmachine replace --name rack1compute02 --resource-group hostedRG --bmc-credentials password=REDACTED username=root --bmc-mac-address 00-00-5E-00-01-00 --boot-mac-address 00-00-5E-00-02-00 --machine-name RACK1COMPUTE02 --serial-number SN123435
(None) BMC login unsuccessful: Fail - Unauthorized; System health test(s) failed: [Additional logs: Server power down at end of test failed with: Unauthorized]
Code: None
Message: BMC login unsuccessful: Fail - Unauthorized; System health test(s) failed: [Additional logs: Server power down at end of test failed with: Unauthorized]

Örnek 3: Ağ hatası nedeniyle donanım doğrulaması başarısız oluyor

$ az networkcloud baremetalmachine replace --name rack1compute02 --resource-group hostedRG --bmc-credentials password=REDACTED username=root --bmc-mac-address 00-00-5E-00-01-00 --boot-mac-address 00-00-5E-00-02-00 --machine-name RACK1COMPUTE02 --serial-number SN123435
(None) Networking test(s) failed: [NIC.Slot.6-1-1_LinkStatus] expected: up; observed: Down; [Additional logs: Link failure detected on NIC.Slot.6-1-1; Unable to perform cabling check on PCI Slot 6]
Code: None
Message: Networking test(s) failed: [NIC.Slot.6-1-1_LinkStatus] expected: up; observed: Down; [Additional logs: Link failure detected on NIC.Slot.6-1-1; Unable to perform cabling check on PCI Slot 6]

Donanım doğrulama hatalarını giderme hakkında daha fazla bilgi için bkz. Donanım Doğrulama Hatası Sorunlarını Giderme.