共用方式為


網路網狀架構執行階段升級

本操作指南定義了確保 Network Fabric 執行時升級成功所需的預升級驗證。 它區分了必要驗證與建議驗證,並釐清它們對升級流程的影響。

必須的升級前驗證

  • 這些檢查是強制性的。
  • 若未達成任何必要的驗證條件,升級即告失敗。
  • 它們作為防止執行時不穩定或升級執行不完整的安全防護。

建議的升級前驗證

  • 這些檢查主要為建議性質,但依然十分鼓勵。
  • 雖然未達標的驗證不會阻礙升級,但有助於確保發布一致性,並降低配置漂移或操作異常的風險。

概觀

執行階段套件組合元件:這些元件需要操作員同意才能進行升級,這可能會影響流量行為或需要重新啟動裝置。 網路結構的設計允許在保持連續資料流量的同時套用更新。

執行階段變更分類如下:

作業系統更新:支援新功能或解決問題所必需的。

基本組態更新:裝置啟動期間套用的初始設定。

配置結構更新:根據使用者輸入產生的隔離域與 ACL 等配置。 這些更新在不改變使用者輸入的情況下適應新功能。

透過遵循本指南,使用者可以確保採用一致、可擴展且安全的方法來升級其網路結構元件。

必須的預升級驗證

在啟動 網路織體(NF)執行時升級 流程前, 使用者必須 先驗證這些資源狀態,才能觸發升級。 這些主動驗證步驟有助於防止升級失敗並避免服務中斷挑戰。 若未達成所需資源狀態,應停止 NNF 升級程序。 在升級的主要里程碑期間可進行觀測,以確保資源狀態保持一致。 建議在 TOR 和 Mgmt 交換器升級後再進行這些檢查。 每次 CE 升級後,應先對 CE 裝置進行驗證,然後再進行下一次 CE 裝置升級。

檢查 期望 升級後檢查適用嗎? RT升級失敗階段
檢查 NFC 佈建狀態 佈建狀態必須處於「成功」 Fabric 升級啟動步驟失敗
檢查網路網狀架構資源的系統管理鎖定狀態 必須處於解除鎖定狀態 - Azure 操作員連接點 - 如何使用系統管理鎖定或解除鎖定網路網狀架構 - 操作員連接點 Fabric 升級啟動步驟失敗
網路網狀架構資源狀態檢查 必須驗證資源狀態:
• 行政狀態為「啟用」
• 配置狀態為「成功」
• 配置狀態為「配置中」
Yes Fabric 升級啟動指令失敗
結構裝置 - NPB、TOR、CE、Mgmt交換機 必須驗證資源狀態:
• 行政狀態為「啟用」
• 配置狀態為「成功」
• 組態狀態為「成功」
Yes 對應裝置升級指令失敗
NNF 裝置磁碟空間 /mnt 目錄中所有正在升級的網路設備中,至少有 2.5 GB 的空閒空間 對應裝置升級指令失敗
BGP 摘要驗證 確保在所有VRF上建立BGP會話(在CE上執行show ip bgp summary vrf all命令) Yes CE 裝置升級指令失敗(可能與 PE 連線問題)
GNMI 指標排放 確認正在為訂閱路徑發送 GNMI 指標 Yes 對應裝置升級指令失敗(可能連線問題)
終端機伺服器 終端機伺服器應確認可存取且可執行 Fabric 升級啟動指令失敗
網路到網路連接 (NNI)
NNI 中引用的網路介面
網路監視器 (BMP)
ACL 和相關資源
入口ACL、CPU和CP TP ACL
L2ISD 資源
L3ISD 資源
路由政策
IP前綴
知識產權社區
IP 擴展社區
當資源的管理狀態處於「已啟用」狀態時:
• 配置狀態為「成功」
• 組態狀態為「成功」

當資源的管理狀態為「已停用」時,資源不會影響執行階段升級
Fabric 升級啟動指令失敗
L3 ISD中提及的內部和外部網路 當L3 ISD管理狀態處於「已啟用」狀態時:
• 內部和外部網路:管理狀態為「已啟用」狀態
• 配置狀態為「成功」
• 組態狀態為「成功」狀態
Fabric 升級啟動指令失敗
網路點頭 當資源的管理狀態處於「已啟用」狀態時:
• 供應狀態應為「繼承」狀態
• 配置狀態為「成功」或「接受」狀態
Fabric 升級啟動指令失敗
網路截取規則、網路對網路介面(NNI)及與網路截取相關的內部網路 父網路端口的管理狀態為「已啟用」:
• 佈建狀態必須處於「成功」狀態
• 組態狀態為「成功」或「已接受」
Fabric 升級啟動指令失敗
與網路監聽器相關的鄰居群組 父網路端口的管理狀態為「已啟用」:
• 佈建狀態必須處於「成功」狀態
Fabric 升級啟動指令失敗

在啟動網路織體(NF)執行時升級流程前, 建議 使用者在觸發 NF 升級前先驗證這些資源狀態。 這些資源不會阻止升級,但應該在升級前後檢查,以確認狀態是否一致。

NNF 資源 期望
網路架構的線纜驗證 所有連結連線都應根據 BOM 描述上線且穩定 - 驗證 Nexus 網路架構的纜線 - Nexus 操作員

Nexus Fabric 升級步驟

步驟0:網路網狀架構狀態

az networkfabric fabric show -g xxxxxx --resource-name xxxxxxx

預期產出摘錄:

**"administrativeState": "Enabled",**

**"configurationState": "Provisioned"**

"fabricASN": 65025,

"fabricVersion": "5.0.0",

"fabricLocks": [ { "lockState": "Disabled", "lockType": "Configuration" } ]

步驟 1:觸發升級

Nexus Network Fabric 客戶使用 AZ CLI 或入口網站在 NetworkFabric 上觸發升級 POST 操作,並請求有效負載如下:

範例 az CLI 命令

az networkfabric fabric upgrade -g xxxx --resource-name xxxx --action start --version "6.1.0"

在上述 POST 動作要求中,受控網路網狀架構資源提供者 (RP) 會執行驗證檢查,以判斷是否允許從目前網狀架構版本進行版本升級。

上述命令會將網路網狀架構標示為「維護中」模式,並防止網路網狀架構執行個體內的任何建立或更新作業。

步驟 2:觸發每個裝置的升級

Nexus Network Fabric 客戶觸發每個裝置的升級 POST 動作。 每個 NNF 裝置資源狀態必須在 Azure 入口網站或 Azure CLI 中驗證:

  • 配置狀態為 繼任 狀態
  • 配置狀態為成功控制( Succeeded )或 延遲控制(DeferredControl
  • 管理狀態處於已啟用狀態

每個 NNF 裝置在觸發升級後都會進入維護模式。 交通被排空,路線廣告也被停止。

NNF 升級順序

  • 奇數編號的 TOR(並行)
  • 偶數編號的 TOR(並行)
  • 計算機架管理交換器(並聯)
  • CE1
  • 等五分鐘
  • CE2
  • NPB(串行)
  • 聚合機架管理交換器(序列)

升級中驗證步驟:

  • 在上述每個升級步驟之間執行中期升級檢查。
  • 驗證 EOS 版本
  • 驗證結構裝置資源狀態
  • 驗證裝置狀態不應該處於維護模式
  • 驗證 BGP 會話狀態(如適用)
  • Azure 連線的遙測準確度。

若升級在任何階段失敗,或任何升級中檢查未通過,請與 Microsoft 支援團隊聯繫,以診斷並解決升級失敗問題。

範例 az CLI 命令

az networkfabric device upgrade --version 6.1.0 -g xxxx --resource-name xxx-CompRack1-TOR1 --debug

步驟 2 的後驗證

在所有 Network Fabric 裝置升級完成後,使用者必須確保沒有任何 NNF 裝置處於「維護中」狀態,且這些裝置的執行時版本必須顯示最新的執行時版本,方法是執行以下指令。

範例 az CLI 命令:

az networkfabric device list -g <resource-group> --query "[].{name:name,version:version}" -o table

步驟 3:完成升級

當所有 NNF 裝置成功升級至最新版本(即 6.1.0)後,Nexus Network Fabric 客戶執行以下指令,將網路架構從維護狀態中移除並完成升級程序。

範例 az CLI 命令

az networkfabric fabric upgrade --action complete --version "6.1.0" -g "<resource-group>" --resource-name "<fabric-name>" --debug

網狀架構升級完成後,我們可以執行下列 az cli 命令來確認網路網狀架構的狀態:

az networkfabric fabric show -g <resource-group> --resource-name <fabric-name> az networkfabric fabric list -g xxxxx --query "[].{name:name,fabricVersion:fabricVersion,configurationState:configurationState,provisioningState:provisioningState}" -o table

步驟 4:憑證輪替 (選用步驟)。

執行動作的客戶必須在每個認證輪替週期完成後驗證裝置的維護模式狀態。 該裝置在憑證輪替後不應該停留在維護不足狀態。

升級後驗證步驟

NNF RT升級後動作 期望
版本合規性 所有 Network Fabric 裝置必須達到指定的 RT 版本
維護狀態檢查 確保TOR和CE裝置的維護狀態為 "NOT under Maintenance"(執行 show maintenance runro 指令)
連線驗證 確認 CE ↔ PE 連線是否穩定,或與升級前狀態相似(顯示 IP 介面簡短 runro 指令)
BGP 摘要驗證 確保在所有VRF上建立BGP會話(在CE上執行show ip bgp summary vrf all命令)
GNMI 指標排放 確認 GNMI 指標是否有針對所訂閱的路徑被發出(可透過儀表板或 CLI 檢查)

附錄

下表概述與本指南稍早參考的所選升級前和升級後動作相關聯的逐步程式

表中的每個條目都對應一個特定的操作,提供詳細的說明、相關參數和操作說明,以確保成功實施。 本附錄可作為尋求加深理解並自信地執行 NNF 升級程序的使用者的實用參考

Action 詳細步驟
裝置映像驗證 在每個 NF 裝置上執行「show version」runro 命令,確認已安裝最新的映像版本。 az NetworkFabric 裝置 run-ro -g xxxx -resource-name xxxx -ro-command 「顯示版本」。上述輸出必須反映最新映像檔版本,依據發行文件。
維護狀態檢查 透過執行「show maintenance」runro 指令,確認 TOR 和 CE 裝置狀態沒有維護中。 上述狀態不得為「維護模式已停用」。
連線驗證 驗證CE ↔ PE連線是否穩定。 “show ip interface brief” runro 指令。
BGP 摘要驗證 確保所有 VRF 都能建立 BGP 會話,方法是在 CE 裝置上執行「show ip bgp summary vrf all」「runro command」。 必須確保上述狀態中的對等節點處於已建立狀態,與升級前的狀態一致。

下表列出本文件中提及的所有資源類型

資源類型 資源提供者命名空間
NFC microsoft.managednetworkfabric/NetworkFabricControllers
NF 系列 microsoft.managednetworkfabric/networkfabrics
NNI Microsoft.managednetworkfabric/networkfabrics/networktonetworkinterconnects
BMP microsoft.managednetworkfabric/networkmonitors
ACL microsoft.managednetworkfabric/accesscontrollists
L2 ISD microsoft.managednetworkfabric/l2isolationdomains
L3 ISD microsoft.managednetworkfabric/l3isolationdomains
路由政策 microsoft.managedNetworkFabric/routePolicies
IP 首碼 microsoft.managedNetworkFabric/IpPrefixes
知識產權社區 microsoft.managedNetworkFabric/IpCommunities
IP 延伸。 社群 microsoft.managedNetworkFabric/IpExtendedCommunities
內部網路 Microsoft.ManagedNetworkFabric/L3IsolationDomains/InternalNetworks
外部網路 Microsoft.ManagedNetworkFabric/L3IsolationDomains/ExternalNetworks
網路資料擷取器 microsoft.managednetworkfabric/networktaps
網路分流規則 microsoft.managednetworkfabric/networktap規則
NPB microsoft.managednetworkfabric/networkpacketbrokers
網路裝置 microsoft.managednetworkfabric/NetworkDevices
網路介面 microsoft.managednetworkfabric/networkDevices/networkInterfaces