Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Tento článek popisuje, jak řešit potíže s neúspěšným ověřením hardwaru serveru (HWV).
HWV se spouští jako součást akce nasazení clusteru a holé akce.replace
HWV ověří holý metalický stroj (BMM) provedením testovacích scénářů na řadiči základní desky (BMC).
Platforma Azure Operator Nexus je nasazená na serverech Dell. Servery Dell používají integrovaný řadič vzdáleného přístupu Dell (iDRAC), což je ekvivalent BMC (Baseboard Management Controller).
Požadavky
- Nainstalujte nejnovější verzi příslušných rozšíření CLI.
- Požádejte o přístup ke spuštění síťové struktury Azure Operator Nexus a příkazů rozšíření pro rozhraní příkazového řádku pro síťový cloud.
- Přihlaste se k Azure CLI a vyberte předplatné, ve kterém je cluster nasazený.
- Shromážděte následující informace:
- ID předplatného (
SUBSCRIPTION) - Název clusteru (
CLUSTER) - Skupina prostředků (
CLUSTER_RG) - Spravovaná skupina prostředků (
CLUSTER_MRG) – Prostředky BMM (BareMetal Machines) se nacházejí ve spravované skupině prostředků. - Název stroje BareMetal (
BMM_NAME), který vyžaduje provedení operací správy životního cyklu
- ID předplatného (
- Požádejte o přístup k pracovnímu prostoru Log Analytics clusteru (LAW).
- Přístup k webovému uživatelskému rozhraní řadiče základní desky (BMC) nebo k přestupní stanici, která umožňuje spuštění nástroje
racadm.
Vyhledání výsledků ověření hardwaru
Pokud během akce BMM (Bare Metal Machine) Replace selhalo ověření hardwaru, měly by být v výsledku Replace akce a protokolu aktivit BMM k dispozici podrobné výsledky chyb. Další informace naleznete v tématu Nahrazení holého počítače.
V opačném případě vyhledejte výsledky ověření hardwaru v pracovním prostoru Log Analytics clusteru (LAW) následujícím způsobem.
Přejděte do skupiny prostředků clusteru v předplatném.
Rozšiřte prostředek LAW pro cluster.
Přejděte na kartu *Logs##.
Načtěte výsledky ověření hardwaru dotazem na tabulku
HWVal_CLpodle následujícího příkladu:
Prozkoumání výsledků ověření hardwaru
Výsledek HWV pro konkrétní server zahrnuje následující kategorie:
system_infodrive_infonetwork_infohealth_infoboot_info
Rozbalením result_detail konkrétní kategorie zobrazíte podrobné výsledky.
Řešení konkrétních chyb
Tato část popisuje řešení potíží, se kterými se můžete setkat.
Kategorie systémových informací
Selhání paměti RAM (memory_capacity_GB) měřené v GiB
Specifikace paměti jsou definovány ve verzi. Paměť pod prahovou hodnotou označuje chybějící nebo neúspěšný duální vložený modul paměti (DIMM).
Vadný DIMM se také projeví v health_info kategorii. Následující příklad ukazuje neúspěšnou kontrolu paměti.
{
"field_name": "memory_capacity_GB",
"comparison_result": "Fail",
"expected": "512",
"fetched": "480"
}
Chcete-li zkontrolovat informace o paměti ve webovém uživatelském rozhraní řadiče pro správu základní desky, postupujte podle navigační cesty BMC ->System ->Memory.
Kontrola informací o paměti pomocí racadm:
racadm --nocertwarn -r $IP -u $BMC_USR -p $BMC_PWD hwinventory | grep SysMemTotalSize
Pokud chcete vyřešit problém s pamětí, obraťte se na dodavatele.
Selhání související s procesorem (cpu_sockets)
Specifikace procesoru jsou definovány ve verzi. Neúspěšná cpu_sockets kontrola značí neshodu procesoru nebo počtu procesorů. Následující příklad ukazuje neúspěšnou kontrolu procesoru.
{
"field_name": "cpu_sockets",
"comparison_result": "Fail",
"expected": "2",
"fetched": "1"
}
Pokud chcete zkontrolovat informace o procesoru ve webovém uživatelském rozhraní řadiče pro správu základní desky, postupujte podle navigační cesty BMC ->System ->CPU.
Kontrola informací o procesoru pomocí racadm:
racadm --nocertwarn -r $IP -u $BMC_USR -p $BMC_PWD hwinventory | grep PopulatedCPUSockets
Pokud chcete vyřešit potíže s procesorem, obraťte se na dodavatele.
Selhání kontroly modelu (Model)
Selhání kontroly Model značí, že do slotu v racku je umístěn nesprávný server nebo že došlo k nesouhlasu kabeláže. Následující příklad ukazuje neúspěšnou kontrolu modelu.
{
"field_name": "Model",
"comparison_result": "Fail",
"expected": "R750",
"fetched": "R650"
}
Pokud chcete zkontrolovat informace o modelu ve webovém uživatelském rozhraní BMC, postupujte podle navigační cesty BMC –>Dashboard – Zobrazit model.
Kontrola informací o modelu pomocí racadm:
racadm --nocertwarn -r $IP -u $BMC_USR -p $BMC_PWD getsysinfo | grep Model
Pokud chcete tento problém vyřešit, ujistěte se, že je server umístěn ve správné pozici v racku a že je také správně zapojený kabeláž, a že serveru je přiřazena správná IP adresa.
Selhání kontroly sériového čísla (Serial_Number)
Sériové číslo serveru, označované také jako značka služby, je definováno v clusteru.
Neúspěšná Serial_Number kontrola označuje neshodu mezi sériovým číslem v clusteru a skutečným sériovým číslem počítače.
Následující příklad ukazuje neúspěšnou kontrolu sériového čísla.
{
"field_name": "Serial_Number",
"comparison_result": "Fail",
"expected": "1234567",
"fetched": "7654321"
}
Pokud chcete zkontrolovat informace o sériovém čísle ve webovém uživatelském rozhraní řadiče správy základní desky, postupujte podle navigační cesty BMC –>Dashboard – zobrazit servisní značku.
Kontrola informací o sériovém čísle pomocí racadm:
racadm --nocertwarn -r $IP -u $BMC_USR -p $BMC_PWD getsysinfo | grep "Service Tag"
Pokud chcete tento problém vyřešit, ujistěte se, že je server umístěn ve správné pozici v racku a že je také správně zapojený kabeláž, a že serveru je přiřazena správná IP adresa.
Selhání kontroly licencí iDRAC
Všechny iDRAC vyžadují časově neomezenou nebo produkční licenci datacentra nebo podnikovou licenci.
Zkušební licence jsou platné jenom 30 dní.
iDRAC License Check Chyba značí, že chybí požadovaná licence iDRAC.
Následující příklady ukazují neúspěšnou kontrolu licence iDRAC pro zkušební licenci a chybějící licenci.
{
"field_name": "iDRAC License Check",
"comparison_result": "Fail",
"expected": "idrac9 x5 datacenter license or idrac9 x5 enterprise license - perpetual or production",
"fetched": "iDRAC9 x5 Datacenter Trial License - Trial"
}
{
"field_name": "iDRAC License Check",
"comparison_result": "Fail",
"expected": "idrac9 x5 datacenter license or idrac9 x5 enterprise license - perpetual or production",
"fetched": ""
}
Pokud chcete tento problém vyřešit, obraťte se na dodavatele a získejte správnou licenci.
Použijte licenci pomocí webového uživatelského rozhraní iDRAC v následující navigační cestě BMC ->Configuration ->Licenses.
Kontroly verzí firmwaru
Kontroly verzí firmwaru byly zavedeny ve verzi 3.9. Následující příklad ukazuje očekávaný protokol pro verze starší než 3.9.
{
"system_info": {
"system_info_result": "Pass",
"result_log": ["Firmware validation not supported in release 3.8"]
}
}
Verze firmwaru se určují na základě cluster version hodnoty v clusterovém objektu.
Následující příklad ukazuje neúspěšnou kontrolu z důvodu neurčité verze clusteru.
Pokud k tomuto problému dojde, ověřte verzi v objektu clusteru.
{
"system_info": {
"system_info_result": "Fail",
"result_log": ["Unable to determine firmware release"]
}
}
Verze firmwaru se protokolují jako informační. Následující verze firmwaru komponent se obvykle protokolují v závislosti na hardwarovém modelu.
- BIOS
- iDRAC
- Komplexní programovatelné logické zařízení (CPLD)
- Řadič redundantního pole nezávislých disků (RAID)
- Základní deska
- Broadcom/Mellanox/NVIDIA Network Interface Card (NIC)
Architektura HWV identifikuje problematické verze firmwaru a pokusí se je opravit automaticky. Verze komponent pro automatickou opravu HWV jsou založeny na vydáních. Následující příklad ukazuje úspěšnou opravu firmwaru iDRAC. (Verze a ID úlohy jsou určené jenom pro ilustraci.)
{
"system_info": {
"system_info_result": "Pass",
"result_detail": [
{
"field_name": "Integrated Dell Remote Access Controller - unsupported_firmware_check",
"comparison_result": "Pass",
"expected": "6.00.30.00 - unsupported_firmware",
"fetched": "7.10.30.00"
}
],
"result_log": [
"Firmware autofix task /redfish/v1/TaskService/Tasks/JID_274085357727 completed"
]
}
}
Poznámka:
Architektura automatické opravy firmwaru HWV byla rozšířena tak, aby zahrnovala CPLD pro modely Ice Lake ve verzi 2510.1 (NC4.7.0).
Kategorie Informace o jednotce
Selhání kontrol disků
Specifikace disků jsou definovány ve verzi. Hodnoty kapacity, které se neshodují, naznačují nevhodné jednotky nebo jednotky vložené do nesprávných slotů. Chybějící kapacita a načtené hodnoty typu označují jednotky, které selhaly, chybí nebo byly vloženy do nesprávných slotů.
{
"field_name": "Disk_0_Capacity_GB",
"comparison_result": "Fail",
"expected": "893",
"fetched": "3576"
}
{
"field_name": "Disk_0_Capacity_GB",
"comparison_result": "Fail",
"expected": "893",
"fetched": ""
}
{
"field_name": "Disk_0_Type",
"comparison_result": "Fail",
"expected": "SSD",
"fetched": ""
}
Chcete-li zkontrolovat informace o disku ve webovém uživatelském rozhraní BMC, postupujte podle navigační cesty BMC ->Storage ->Physical Disks.
Informace o disku můžete zkontrolovat pomocí racadm:
racadm --nocertwarn -r $IP -u $BMC_USR -p $BMC_PWD raid get pdisks -o -p State,Size
Pokud chcete řešit potíže, ujistěte se, že jsou disky vložené do správných slotů. Pokud problém přetrvává, obraťte se na dodavatele.
Kategorie informace o síti
Selhání kontroly síťových rozhraní karet
Specifikace síťových adaptérů serveru Dell jsou definovány v dané verzi. Neshodný stav propojení označuje volné nebo vadné kabeláže nebo křížové kabely. Neshodovaný model označuje, že se do slotu vloží nesprávná karta síťové karty. Chybějící odkaz nebo načtené hodnoty modelu označují síťové karty, které selhaly, chybí nebo byly vloženy do nesprávných slotů.
{
"field_name": "NIC.Slot.3-1-1_LinkStatus",
"comparison_result": "Fail",
"expected": "Up",
"fetched": "Down"
}
{
"field_name": "NIC.Embedded.2-1-1_LinkStatus",
"comparison_result": "Fail",
"expected": "Down",
"fetched": "Up"
}
{
"field_name": "NIC.Slot.3-1-1_Model",
"comparison_result": "Fail",
"expected": "ConnectX-6",
"fetched": "BCM5720"
}
{
"field_name": "NIC.Slot.3-1-1_LinkStatus",
"comparison_result": "Fail",
"expected": "Up",
"fetched": ""
}
{
"field_name": "NIC.Slot.3-1-1_Model",
"comparison_result": "Fail",
"expected": "ConnectX-6",
"fetched": ""
}
Pokud chcete zkontrolovat informace o síťové kartě ve webovém uživatelském rozhraní BMC, postupujte podle navigační cesty BMC ->System ->Network Devices.
Ke kontrole všech informací o síťové kartě použijte racadm:
racadm --nocertwarn -r $IP -u $BMC_USR -p $BMC_PWD hwinventory NIC
Pokud chcete zkontrolovat konkrétní síťovou kartu pomocí racadm, zadejte úplný popisovač zařízení:
racadm --nocertwarn -r $IP -u $BMC_USR -p $BMC_PWD hwinventory NIC.Embedded.1-1-1
Pokud chcete vyřešit potíže, ujistěte se, že jsou servery správně připojené a že jsou propojené porty. Restartujte port v síťové infrastruktuře. Proveďte bleší odtok. Pokud problém přetrvává, obraťte se na dodavatele.
Zkontrolovat informace o přepínači vrstvy 2 pro síťovou kartu.
HWV hlásí informace o přepínači vrstvy 2 pro každé serverové rozhraní. ID připojení přepínače (MAC rozhraní přepínače) a ID portu připojení přepínače (popisek rozhraní přepínače) jsou informativní.
{
"field_name": "NIC.Slot.3-1-1_SwitchConnectionID",
"comparison_result": "Info",
"expected": "unknown",
"fetched": "c0:d6:82:23:0c:7d"
}
{
"field_name": "NIC.Slot.3-1-1_SwitchPortConnectionID",
"comparison_result": "Info",
"expected": "unknown",
"fetched": "Ethernet10/1"
}
Kontroly kabeláže pro svázaná rozhraní
Neshoda kabeláže je hlášena v result_logsouboru . Kontrola kabelu ověří, jestli se sloučené síťové karty připojují k portům přepínačů se stejným ID portu.
V následujícím příkladu se periferní komponenta propojení (PCI) 3/1 a 3/2 připojují k Ethernet1/1 a Ethernet1/3 na TOR, což způsobuje selhání HWV.
{
"network_info": {
"network_info_result": "Fail",
"result_detail": [
{
"field_name": "NIC.Slot.3-1-1_SwitchPortConnectionID",
"fetched": "Ethernet1/1"
},
{
"field_name": "NIC.Slot.3-2-1_SwitchPortConnectionID",
"fetched": "Ethernet1/3"
}
],
"result_log": [
"Cabling problem detected on PCI Slot 3 - server NIC.Slot.3-1-1 connected to switch Ethernet1/1 - server NIC.Slot.3-2-1 connected to switch Ethernet1/3"
]
}
}
Chcete-li tento problém vyřešit, vložte kabely do správných rozhraní.
Chyba kontroly adresy MAC iDRAC (BMC)
Adresa mac iDRAC je definována v clusteru pro každý holý počítač.
Neúspěšná iDRAC_MAC kontrola značí neshodu mezi MAC adresou v iDRAC/BMC v clusteru a skutečnou MAC adresou načtenou z počítače.
{
"field_name": "iDRAC_MAC",
"comparison_result": "Fail",
"expected": "aa:bb:cc:dd:ee:ff",
"fetched": "aa:bb:cc:dd:ee:gg"
}
Pokud chcete tento problém vyřešit, ujistěte se, že je v clusteru definovaná správná adresa MAC. Pokud je MAC adresa v objektu clusteru správná, pokuste se o sifonový odtok. Pokud problém přetrvává, ujistěte se, že je server umístěn v racku na správném místě, správně připojen a že je přiřazena správná IP adresa.
Selhání kontroly adresy MAC při spuštění prostředí PXE
Adresa MAC PXE je definována v clusteru pro každý holý počítač.
Neúspěšná PXE_MAC kontrola značí neshodu mezi macem PXE v clusteru a skutečnou adresou MAC načtenou z počítače.
{
"field_name": "NIC.Embedded.1-1_PXE_MAC",
"comparison_result": "Fail",
"expected": "aa:bb:cc:dd:ee:ff",
"fetched": "aa:bb:cc:dd:ee:gg"
}
Pokud chcete tento problém vyřešit, ujistěte se, že je v clusteru definovaná správná adresa MAC. Pokud je MAC adresa v objektu clusteru správná, pokuste se o sifonový odtok. Pokud problém přetrvává, ujistěte se, že je server umístěn v racku na správném místě, správně připojen a že je přiřazena správná IP adresa.
Kategorie zdravotních údajů
Selhání senzoru kontroly stavu
Kontroly stavu serveru pokrývají různé senzory hardwarových komponent. Senzor stavu, který selhal, značí problém s odpovídající hardwarovou komponentou. Následující příklady označují selhání ventilátoru, jednotky a procesoru.
{
"field_name": "System Board Fan1A",
"comparison_result": "Fail",
"expected": "Enabled-OK",
"fetched": "Enabled-Critical"
}
{
"field_name": "Solid State Disk 0:1:1",
"comparison_result": "Fail",
"expected": "Enabled-OK",
"fetched": "Enabled-Critical"
}
{
"field_name": "CPU.Socket.1",
"comparison_result": "Fail",
"expected": "Enabled-OK",
"fetched": "Enabled-Critical"
}
Pokud chcete zkontrolovat informace o stavu v BMC webovém uživatelském rozhraní, postupujte podle navigační cesty BMC –>Dashboard - Zobrazit informace o stavu.
Kontrola informací o stavu pomocí racadm:
racadm --nocertwarn -r $IP -u $BMC_USR -p $BMC_PWD getsensorinfo
Pokud chcete vyřešit potíže se selháním stavu serveru, obraťte se na dodavatele.
Selhání protokolu životního cyklu kontroly stavu (LC)
Kontroly stavu serveru Dell selžou u nedávných kritických alarmů v protokolu „LC Log“. Modul plug-in pro ověření hardwaru zaznamená ID alarmu, název a časové razítko. Nedávné kritické alarmy naznačují potřebu dalšího šetření. Následující příklad ukazuje selhání u kritického alarmu napětí na propojovací desce.
{
"field_name": "LCLog_Critical_Alarms",
"comparison_result": "Fail",
"expected": "No Critical Errors",
"fetched": "53539 2023-07-22T23:44:06-05:00 The system board BP1 PG voltage is outside of range."
}
- Chyby virtuálního disku obvykle označují falešně pozitivní stav vyčištění RAID. Tyto události jsou protokolovány kvůli načasování vyčištění RAID a vypnutí systému před HWV. Následující příklad ukazuje kritickou chybu protokolu LC na virtuálním disku 238. Pokud dojde k několika chybám, které blokují nasazení, odstraňte cluster, počkejte dvě hodiny a pak znovu spusťte nasazení clusteru. Pokud selhání neblokují nasazení, počkejte dvě hodiny a spusťte holý počítač
replace. - Chyby virtuálního disku jsou na seznamu povolených počínaje verzí 3.13 a nezpůsobují selhání kontroly stavu.
{
"field_name": "LCLog_Critical_Alarms",
"comparison_result": "Fail",
"expected": "No Critical Errors",
"fetched": "104473 2024-07-26T16:05:19-05:00 Virtual Disk 238 on RAID Controller in SL 3 has failed."
}
Kritické alarmy a varovné alarmy uvedené na seznamu povolených jsou protokolovány jako informativní od verze Azure Operator Nexus 3.14.
{
"field_name": "LCLog_Warning_Alarms - Non-Failing",
"comparison_result": "Info",
"expected": "Warning Alarm",
"fetched": "104473 2024-07-26T16:05:19-05:00 The Embedded NIC 1 Port 1 network link is down."
}
Pokud chcete zkontrolovat protokoly LC ve webovém uživatelském rozhraní BMC, postupujte podle navigační cesty BMC ->Maintenance ->Lifecycle Log.
Ke kontrole kritických alarmů protokolu LC pomocí racadm:
racadm --nocertwarn -r $IP -u $BMC_USR -p $BMC_PWD lclog view -s critical
Pokud Backplane Comm jsou zaznamenány kritické chyby, proveďte odtok blech. Obraťte se na dodavatele a vyřešte případné další kritické chyby protokolu LC.
Selhání akcí řízení napájení serverů při kontrole stavu
Kontroly stavu serveru Dell selžou, pokud nedošlo k selhání napájení serveru nebo selhalo resetování iDRAC. Neúspěšná akce řízení serveru označuje základní problém s hardwarem. Následující příklad ukazuje neúspěšný pokus o zapnutí.
{
"field_name": "Server Control Actions",
"comparison_result": "Fail",
"expected": "Success",
"fetched": "Failed"
}
"result_log": [
"Server power up failed with: server OS is powered off after successful power on attempt",
]
Pokud chcete zapnout server v uživatelském rozhraní BMC ve webovém prohlížeči, postupujte podle navigační cesty BMC ->Dashboard ->Power On System.
Jak zapnout server pomocí racadm:
racadm --nocertwarn -r $IP -u $BMC_USR -p $BMC_PWD serveraction powerup
Pokud chcete vyřešit potíže se selháním napájení serveru, pokuste se o odtok blech. Pokud problém přetrvává, obraťte se na dodavatele.
Virtuální bleší odtok
HWV se pokusí o virtuální bleší odtok pro většinu neúspěšných kontrol. Pokusy o odtok blech jsou zaznamenány pod health_info>result_log.
"result_log": [
"flea drain completed successfully",
]
Pokud virtuální bleší odtok selže, proveďte fyzický bleší odtok jako první krok řešení potíží.
Selhání úklidu RAID
V rámci čištění RAID se konfigurace kontroleru RAID resetuje. Kontrola stavu serveru Dell selže kvůli selhání resetování kontroleru RAID. Neúspěšná akce vyčištění RAID značí problém se základním hardwarem. Následující příklad ukazuje neúspěšné resetování kontroleru RAID.
{
"field_name": "Server Control Actions",
"comparison_result": "Fail",
"expected": "Success",
"fetched": "Failed"
}
"result_log": [
"RAID cleanup failed with: raid deletion failed after 2 attempts",
]
Chcete-li vymazat RAID ve webovém uživatelském rozhraní BMC, postupujte podle navigační cesty, vyberte BMC>Dashboard>Storage>Controllers>Actions>Reset Configuration.
Pokud chcete vymazat raid s racadm, zkontrolujte řadiče RAID a pak zrušte konfiguraci:
racadm --nocertwarn -r $IP -u $BMC_USR -p $BMC_PWD storage get controllers | grep "RAID"
racadm --nocertwarn -r $IP -u $BMC_USR -p $BC_PWD storage resetconfig:RAID.SL.3-1 #substitute with RAID controller from get command
racadm --nocertwarn -r $IP -u $BMC_USR -p $BC_PWD jobqueue create RAID.SL.3-1 --realtime #substitute with RAID controller from get command
Při řešení potíží se selháním vyčištění RAID zkontrolujte všechny protokolované chyby. Pro Dell R650/660 ujistěte se, že pouze sloty 0 a 1 obsahují fyzické jednotky. Pro Dell R750/760 se ujistěte, že pouze sloty 0 až 3 obsahují fyzické jednotky. U všech ostatních modelů ověřte, že podle definice verze nejsou vloženy žádné další jednotky. Všechny přebytečné jednotky by měly být odebrány, aby odpovídaly verzi. Pokud problém přetrvává, obraťte se na dodavatele.
Během HWV můžete ignorovat kritické výstrahy pro virtuální disk BMC.
Selhání napájení při kontrole stavu a úvahy o redundanci
Kontroly stavu serveru Dell varují, když chybí nebo selhal jeden napájecí zdroj.
field_name Zdroj napájení se může zobrazit jako 0/PS0/Napájecí zdroj 0 a 1/PS1/Napájecí zdroj 1 pro první a druhý napájecí zdroj v uvedeném pořadí.
Selhání jednoho napájecího zdroje neaktivuje selhání zařízení HWV.
{
"field_name": "Power Supply 1",
"comparison_result": "Warning",
"expected": "Enabled-OK",
"fetched": "UnavailableOffline-Critical"
}
{
"field_name": "System Board PS Redundancy",
"comparison_result": "Warning",
"expected": "Enabled-OK",
"fetched": "Enabled-Critical"
}
Pokud chcete zkontrolovat napájecí zdroje ve webovém uživatelském rozhraní BMC, postupujte podle navigační cesty, vyberte BMC>System>Power.
Kontrola napájecích zdrojů pomocí racadm:
racadm --nocertwarn -r $IP -u $BMC_USR -p $BMC_PWD getsensorinfo | grep PS
Problém může vyřešit obnovení napájecího zdroje. Pokud alarmy potrvají, obraťte se na dodavatele.
Kategorie bootovacích informací
Důležité informace o kontrole názvu spouštěcího zařízení
- Kontrola
boot_device_nameje aktuálně informativní. - Neshodovaný název spouštěcího zařízení by neměl aktivovat selhání zařízení.
{
"field_name": "boot_device_name",
"comparison_result": "Info",
"expected": "NIC.PxeDevice.1-1",
"fetched": "NIC.PxeDevice.1-1"
}
Důležité informace o kontrolách zařízení PXE
- Tato kontrola ověří nastavení zařízení PXE.
- Od verze
2024-07-01, rozhraní API GA se HWV pokusí automaticky opravit nastavení spouštění systému BIOS. - Selhání
pxe_device_1_namenebopxe_device_1_statekontroly značí problém s konfigurací PXE. - Pokud chcete povolit spouštění systému během nasazování, musí být opraveno nastavení, které selhalo.
{
"field_name": "pxe_device_1_name",
"comparison_result": "Fail",
"expected": "NIC.Embedded.1-1-1",
"fetched": "NIC.Embedded.1-2-1"
}
{
"field_name": "pxe_device_1_state",
"comparison_result": "Fail",
"expected": "Enabled",
"fetched": "Disabled"
}
Pokud chcete aktualizovat stav a název zařízení PXE ve webovém uživatelském rozhraní BMC, nastavte hodnotu a pak vyberte **Použít** > **Použít a restartovat**:
-
BMC- ->Configuration>BIOS Settings>Network Settings- - ->PXE Device1>Enabled -
BMC- ->Configuration>BIOS Settings>Network Settings>PXE Device1 Settings- ->Interface>Embedded NIC 1 Port 1 Partition 1
Pokud chcete aktualizovat stav a název zařízení PXE pomocí racadm, spusťte následující příkazy:
racadm --nocertwarn -r $IP -u $BMC_USR -p $BMC_PWD set bios.NetworkSettings.PxeDev1EnDis Enabled
racadm --nocertwarn -r $IP -u $BMC_USR -p $BMC_PWD set bios.PxeDev1Settings.PxeDev1Interface NIC.Embedded.1-1-1
racadm --nocertwarn -r $IP -u $BMC_USR -p $BMC_PWD jobqueue create BIOS.Setup.1-1
racadm --nocertwarn -r $IP -u $BMC_USR -p $BMC_PWD serveraction powercycle
Kontrola přihlášení zařízení
Důležité informace o kontrole přihlášení zařízení
Kontrola device_login selže, pokud není dosažitelný iDRAC nebo pokud se modul plug-in pro ověření hardwaru nemůže přihlásit.
{
"device_login": "Fail - Unreachable"
}
{
"device_login": "Fail - Unauthorized"
}
Poznámka:
Pokud se ověření hardwaru nezdaří kvůli problémům s autentizací přihlašovacích údajů řadiče základní desky (BMC) (Neautorizováno), akce se odmítne, ale holý počítač není označen jako neúspěšný nebo uveden do chybového stavu. Holý stroj si zachovává aktuální provozní stav, zatímco kontrola hardwaru hlásí neúspěšné ověření přihlašovacích údajů.
Chcete-li nastavit heslo ve webovém uživatelském rozhraní BMC, postupujte podle navigační cesty BMC ->iDRAC Settings ->Users ->Local Users ->Edit.
Nastavení hesla pomocí racadm:
racadm -r $BMC_IP -u $BMC_USER -p $CURRENT_PASSWORD set iDRAC.Users.2.Password $BMC_PWD
Při řešení potíží odešlete příkazem ping iDRAC z přístupového serveru s přístupem k síti BMC. Pokud iDRAC odpovídá na příkazy ping, zkontrolujte, jestli se hesla shodují.
Přidání serverů zpět do clusteru po opravě
Po opravení hardwaru spusťte akci Holý počítač replace podle pokynů v části Správa životního cyklu holých počítačů.
Související obsah
- Pokud máte stále dotazy, kontaktujte podpora Azure.
- Další informace o plánech podpory najdete na stránce Plány podpory Azure.