Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Bu makalede, Çıplak Makinelerde (BMM) yaşam döngüsü yönetimi işlemlerinin nasıl gerçekleştirildiği açıklanmaktadır. Bu adımlar, hatalardan kurtarmak veya bakım eylemleri gerçekleştirirken sorun giderme amacıyla kullanılmalıdır.
İlk olarak, işlemlere devam etmeden önce Çıplak Makine İşlemleri için En İyi Yöntemler makalesindeki önerileri okuyun.
Listelenen kalın eylemler kesinti olarak değerlendirilir (Kapatma, Yeniden Başlatma, Yeniden İmajlama, Değiştir).
Parametresi olmayan evacuate
Cordon eylemi kesintiye neden olarak kabul edilmezken, parametreli evacuate
Cordon kesintiye neden olur.
- Çıplak Metal Makineyi Kapatma
- Çıplak Metal Makine Başlat
- Çıplak Metal Makineyi Yeniden Başlat
- Çıplak Makine'yi zamanlanamaz hale getirin (boşaltma olmadan kordon, düğümü boşaltmaz)
- Çıplak Metal Makineyi zamanlanamaz hale getirin (tahliye ile kordon, düğümü boşaltıyor)
- Fiziksel Makineyi zamanlanabilir hale getirme (erişim kısıtlamasını kaldırma)
- Çıplak Metal Makineyi Yeniden İmajlandırma
- Çıplak Makine Değiştirme
Dikkat
İlk olarak Microsoft destek personeline danışmadan denetim veya yönetim düzlemi sunucularına karşı herhangi bir işlem yapmayın; bunu yapmak Operatör Nexus Kümesinin bütünlüğünü etkileyebilir.
Önemli
Kubernetes Denetim Düzlemi (KCP) düğümüne yönelik birden çok kesintiye neden olan komut isteği reddedilir. Bu denetim, Nexus Kümesi örneğinin bütünlüğünü korumak ve eşzamanlı kesintiye neden olan eylemler nedeniyle birden çok KCP düğümünün aynı anda çalışmamasını önlemek için yapılır. Reddedilen kesintili eylem komutları, ya başka bir KCP düğümüne karşı zaten çalışıyor olabilir ya da tüm KCP'nin kullanılabilir olmamasından kaynaklanabilir. Birden çok düğüm çalışma dışı hale gelirse Kubernetes Denetim Düzlemi'nin sağlıklı çoğunluk eşiğini kırar.
Listelenen eylemler, BareMetal Machines (BMM) için kesintiye neden olabilir:
- BMM'yi kapatma
- BMM'yi yeniden başlatma
- BMM'yi planlanamaz hale getirin (kordon ile boşaltma, düğümü tahliye eder)
- BMM'nin imajını yeniden yükleme
- BMM'yi değiştirme
Yalnızca kesintisiz eylemleri bırakmak:
- BMM başlat
- BMM'yi zamanlanamaz hale getirin (tahliye olmadan kordon, düğümü boşaltmaz)
- BMM'yi zamanlanabilir yapmak için engeli kaldırma
Önkoşullar
- Uygun CLI uzantılarının en son sürümünü yükleyin.
- Azure Operatör Nexus ağ dokusu (NF) ve ağ bulut CLI uzantısı komutlarını çalıştırmak için erişim isteyin.
- Azure CLI'da oturum açın ve kümenin dağıtıldığı aboneliği seçin.
- Aşağıdaki bilgileri toplayın:
- Abonelik Kimliği (
SUBSCRIPTION
) - Küme adı (
CLUSTER
) - Kaynak grubu (
CLUSTER_RG
) - Yönetilen kaynak grubu (
CLUSTER_MRG
) - Yönetilen kaynak grubunda BareMetal Machines (BMM) kaynakları bulunur - Yaşam döngüsü yönetimi işlemleri gerektiren Bare Metal Makine Adı (
BMM_NAME
)
- Abonelik Kimliği (
Bare Metal Sunucuyu Kapatma
Önemli
BMM kapatıldıktan veya yeniden başlatıldıktan sonra Nexus VM'lerinin yeniden başlatılamadığı nadir durumlar vardır. Bu durumları önlemek için BMM'yi kapatmadan veya yeniden başlatmadan önce BMM üzerindeki tüm sanal makineleri kapatın.
cordon
komutunu, BMM üzerinde çalışan iş yüklerini bulma talimatları için inceleyin.
Bu komut power-off
, belirtilen bareMetalMachineName
olacaktır.
az networkcloud baremetalmachine power-off \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Çıplak Metal Makine Başlat
Bu komut start
, belirtilen bareMetalMachineName
olacaktır.
az networkcloud baremetalmachine start \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Çıplak Makineyi Yeniden Başlatma
Önemli
BMM kapatıldıktan veya yeniden başlatıldıktan sonra Nexus VM'lerinin yeniden başlatılamadığı nadir durumlar vardır. Bu durumları önlemek için BMM'yi kapatmadan veya yeniden başlatmadan önce BMM üzerindeki tüm sanal makineleri kapatın.
cordon
komutunu, BMM üzerinde çalışan iş yüklerini bulma talimatları için inceleyin.
Bu komut restart
, belirtilen bareMetalMachineName
olacaktır.
az networkcloud baremetalmachine restart \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Bare Metal Makineyi zamanlanamaz olarak işaretleme (kordon)
Komutunu yürüterek cordon
Çıplak Metal Makine'yi zamanlanamaz hale getirebilirsiniz.
Komut çalıştırıldığında, cordon
ayarlandığında Operatör Nexus iş yükleri Çıplak Metal Makine üzerinde zamanlanmaz.
Çıplak Metal Makinesi üzerinde herhangi bir iş yükü oluşturma girişimi, iş yükünün cordoned
durumuna ayarlanmasına neden olur.
İş yükleri boşaltılmadığı sürece, mevcut iş yükleri Çıplak Metal Makine üzerinde çalışmaya devam eder.
Çıplak Metal Makine iş yüklerini boşalt
cordon komutu, varsayılan değeri evacuate
olan ve False
komutunun yeni iş yüklerinin zamanlanmasını engellediği anlamına gelen cordon
parametresini destekler.
cordon
komutuyla iş yüklerini boşaltmak için evacuate
parametresinin True
olarak ayarlanması gerekmektedir.
Bare Metal Makine'de çalışan iş yükleri şunlardır stopped
ve Bare Metal Makine pending
durumuna ayarlanır.
Uyarı
Sunucu kordon altına alınıp boşaltıldığında bile Nexus Yönetim İş Yükleri Çıplak Makinede çalışmaya devam eder.
Bare Metal sunucusunda herhangi bir bakım işlemi gerçekleştirmeye çalışırken evacuate
değerini True
olarak ayarlamak en iyi uygulamadır.
Daha fazla en iyi uygulama için Çıplak Metal Makine İşlemleri için En İyi Uygulamalar'ı okuyun.
az networkcloud baremetalmachine cordon \
--evacuate "True" \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Bir Bare Metal Sunucuda şu anda çalışmakta olan iş yükü olup olmadığını belirlemek için aşağıdaki komutu çalıştırın:
Sanal Makineler için:
az networkcloud baremetalmachine show -n <nodeName> /
--resource-group <resourceGroup> /
--subscription <subscriptionID> | jq '.virtualMachinesAssociatedIds'
Nexus Kubernetes küme düğümleri için: (Nexus Kubernetes kümesinde oturum açmayı gerektirir)
kubectl get nodes <resourceName> -ojson |jq '.metadata.labels."topology.kubernetes.io/baremetalmachine"'
Fiziksel Makineyi zamanlanabilir hale getirme (erişim kısıtlamasını kaldırma)
Komutunu yürüterek uncordon
, Çıplak Metal Makine'yi "zamanlanabilir" yapabilirsiniz (sunucu iş yüklerini barındırabilir).
Bare Metal Makine'deki bir pending
durumundaki tüm iş yükleri, Bare Metal Makine restarted
olduğunda uncordoned
.
az networkcloud baremetalmachine uncordon \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Çıplak Metal Makineyi Yeniden İmajlama
reimage
komutunu yürüterek bir Bare Metal Makinede çalışma zamanı sürümünü geri alabilirsiniz. Eylem, reimage
Bare Metal Makine üzerindeki tenant iş yükü dosyalarını etkilemez.
Bu işlem, çalışma zamanı görüntüsünü hedef Çıplak Metal Makinede yeniden dağıtır ve kümeye özdeş tanımlayıcılarla yeniden katılma adımlarını yürütür.
En iyi uygulama olarak, cordon
komutunu yürütmeden önce Bare Metal Makine'nin iş yüklerinin evacuate
komutunu kullanarak boşaltıldığından ve True
'nin reimage
olarak ayarlandığından emin olun.
Daha fazla en iyi uygulama için Çıplak Metal Makine İşlemleri için En İyi Uygulamalar'ı okuyun.
Önemli
Çıplak Metal Makine erişimi aracılığıyla düğümde gerçekleştirilen yazma veya düzenleme işlemlerinden kaçının.
Microsoft desteğini geri yüklemek için reimage
eylemi gereklidir ve Bare Metal Makine üzerinde yapılan tüm değişiklikler, düğümü beklendiği duruma geri yüklerken kaybolur.
Uyarı
Aynı BareMetal Machine (BMM) kaynağı için aynı anda birden baremetalmachine replace
fazla veya reimage
komut çalıştırmayın.
replace
ve reimage
aynı anda yürütülmesi, sunucuları çalışmaz durumda bırakır.
BMM üzerinde herhangi bir replace
/reimage
'nin tamamen tamamlandığından emin olun ve başka bir tanesine başlamayın.
Ayrıca, belirtilen bakım işlemi gerçekleştirilmediği sürece, yeni bir reimage
eylemini tamamlamış bir BMM'de sıralı replace
eylemler gerçekleştirmekten kaçının.
az networkcloud baremetalmachine reimage \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--subscription <subscriptionID>
Çıplak Metal Makine Değiştirme
replace
Sunucu tam veya kısmi donanım değişimi gerektiren donanım sorunlarıyla karşılaştığında komutunu kullanın.
Anakart veya Ağ Arabirim Kartı (NIC) gibi bileşenleri değiştirdikten sonra Çıplak Makine'nin MAC adresi değişir; ancak, iDRAC IP adresi ve ana bilgisayar adı aynı kalır.
Bir replace
işlem, her donanım bakım işleminden sonra yürütülmelidir. Daha fazla ayrıntı için Bare Metal Makine değiştirme için en iyi yöntemler bölümünü okuyun.
2506.2 sürümünden itibaren iDRAC için parola değeri Key Vault Tekdüzen Kaynak Tanımlayıcısı (URI) veya parola değeri olarak sağlanabilir. Bkz. Key Vault Kimlik Bilgisi Başvurusu. Düz metin parola yerine URI kullanmak ek güvenlik sağlar.
Uyarı
Aynı BareMetal Machine (BMM) kaynağı için aynı anda birden baremetalmachine replace
fazla veya reimage
komut çalıştırmayın.
replace
ve reimage
aynı anda yürütülmesi, sunucuları çalışmaz durumda bırakır.
BMM üzerinde herhangi bir replace
/reimage
'nin tamamen tamamlandığından emin olun ve başka bir tanesine başlamayın.
Ayrıca, belirtilen bakım işlemi gerçekleştirilmediği sürece, yeni bir reimage
eylemini tamamlamış bir BMM'de sıralı replace
eylemler gerçekleştirmekten kaçının.
az networkcloud baremetalmachine replace \
--name <BareMetalMachineName> \
--resource-group <resourceGroup> \
--bmc-credentials password=<PASSWORD_URI or IDRAC_PASSWORD> username=<IDRAC_USER> \
--bmc-mac-address <IDRAC_MAC> \
--boot-mac-address <PXE_MAC> \
--machine-name <OS_HOSTNAME> \
--serial-number <SERIAL_NUMBER> \
--subscription <subscriptionID>
replace
Eylem bir donanım doğrulama hatası nedeniyle başarısız olursa, aşağıdaki örneklerde gösterildiği gibi yanıtta replace
belirli bir hata veya test hatası gösterilir.
Bu bilgiler Çıplak Metal Makine için Etkinlik Günlüğü'nde de bulunabilir (Operatör Nexus).
Hata kodu ve hata iletisi, ilgili BareMetalMachines_Replace
işlemin JSON özelliklerini içerir.
Örnek 1: Temel Kart Yönetim Denetleyicisi (BMC) kimlik bilgileri için geçersiz Key Vault URI'sine bağlı olarak donanım doğrulaması başarısız oluyor
$ az networkcloud baremetalmachine replace --name rack1compute02 --resource-group hostedRG --bmc-credentials password=$KEY_VAULT_URI username=root --bmc-mac-address 00-00-5E-00-01-00 --boot-mac-address 00-00-5E-00-02-00 --machine-name RACK1COMPUTE02 --serial-number SN123435
(failed to retrieve password from key vault) failed to get secret value from key vault: failed to get cluster key vault secret
Code: failed to retrieve password from key vault
Message: failed to retrieve password from key vault
Response: 400 Bad Request
Örnek 2: Donanım doğrulaması, sağlanan geçersiz Temel Kart Yönetim Denetleyicisi (BMC) kimlik bilgileri nedeniyle başarısız oluyor
$ az networkcloud baremetalmachine replace --name rack1compute02 --resource-group hostedRG --bmc-credentials password=REDACTED username=root --bmc-mac-address 00-00-5E-00-01-00 --boot-mac-address 00-00-5E-00-02-00 --machine-name RACK1COMPUTE02 --serial-number SN123435
(None) BMC login unsuccessful: Fail - Unauthorized; System health test(s) failed: [Additional logs: Server power down at end of test failed with: Unauthorized]
Code: None
Message: BMC login unsuccessful: Fail - Unauthorized; System health test(s) failed: [Additional logs: Server power down at end of test failed with: Unauthorized]
Örnek 3: Ağ hatası nedeniyle donanım doğrulaması başarısız oluyor
$ az networkcloud baremetalmachine replace --name rack1compute02 --resource-group hostedRG --bmc-credentials password=REDACTED username=root --bmc-mac-address 00-00-5E-00-01-00 --boot-mac-address 00-00-5E-00-02-00 --machine-name RACK1COMPUTE02 --serial-number SN123435
(None) Networking test(s) failed: [NIC.Slot.6-1-1_LinkStatus] expected: up; observed: Down; [Additional logs: Link failure detected on NIC.Slot.6-1-1; Unable to perform cabling check on PCI Slot 6]
Code: None
Message: Networking test(s) failed: [NIC.Slot.6-1-1_LinkStatus] expected: up; observed: Down; [Additional logs: Link failure detected on NIC.Slot.6-1-1; Unable to perform cabling check on PCI Slot 6]
Donanım doğrulama hatalarını giderme hakkında daha fazla bilgi için bkz. Donanım Doğrulama Hatası Sorunlarını Giderme.