Delen via


Upgrade-sjabloon voor fabric-runtime

Deze handleiding biedt een stapsgewijze sjabloon voor het upgraden van een Nexus Fabric die is ontworpen om gebruikers te helpen bij het beheren van een reproduceerbare end-to-end-upgrade via Azure-API's en standaardbedrijfsprocedures. Regelmatige updates zijn van cruciaal belang voor het onderhouden van systeemintegriteit en het verkrijgen van toegang tot de nieuwste productverbeteringen.

Overzicht

Overzicht van de fabric-runtime-upgradesjabloon

Onderdelen van runtimebundel: voor deze onderdelen is toestemming van de operator vereist voor upgrades die van invloed kunnen zijn op het gedrag van het verkeer of waarvoor het opnieuw opstarten van het apparaat noodzakelijk is. Met het ontwerp van de netwerkinfrastructuur kunnen updates worden toegepast terwijl continue gegevensverkeersstroom behouden blijft.

Runtimewijzigingen worden als volgt gecategoriseerd:

  • Updates van besturingssystemen: nodig om nieuwe functies te ondersteunen of problemen op te lossen.
  • Basisconfiguratie-updates: initiële instellingen die zijn toegepast tijdens het opstarten van het apparaat.
  • Updates van de configuratiestructuur: gegenereerd op basis van gebruikersinvoer voor conf

Vereiste voorwaarden

Vereisten voor het gebruik van deze sjabloon om een Fabric te upgraden
  • Nieuwste versie van Azure CLI.
  • Meest recente managednetworkfabricCLI-extensie.
  • Meest recente networkcloudCLI-extensie.
  • Abonnementstoegang om de CLI-extensieopdrachten van Azure Operator Nexus Network Fabric (NF) en Network Cloud (NC) uit te voeren.
  • De doelstructuur moet gezond zijn en in een operationele staat verkeren, waarbij alle Apparaten gezond zijn.

Vereiste parameters

Parameters die in dit document worden gebruikt
  • <OMGEVING>: - Exemplaarnaam
  • < >AZURE_REGION: - Azure-regio van het exemplaar
  • <CUSTOMER_SUB_NAME: Abonnementsnaam>
  • < >CUSTOMER_SUB_ID: Abonnements-id
  • < >NEXUS_VERSION: Nexus-releaseversie (bijvoorbeeld 2504.1)
  • < >NNF_VERSION: Releaseversie van Operator Nexus Fabric (bijvoorbeeld 8.1)
  • < >NF_VERSION: NF-runtimeversie voor upgrade (bijvoorbeeld 5.0.0)
  • <NFC_NAME>: Geassocieerde Network Fabric Controller (NFC)
  • < >NFC_RG: NFC-resourcegroep
  • < >NFC_RID: NFC ARM ID
  • < >NFC_MRG: beheerde NFC-resourcegroep
  • < >NF_NAME: Netwerkinfrastructuurnaam
  • < >NF_RG: Network Fabric-resourcegroep
  • < >NF_RID: ARM-id voor netwerkinfrastructuur
  • < >NF_DEVICE_NAME: Network Fabric-apparaatnaam
  • < >NF_DEVICE_RID: Resource-id van Network Fabric-apparaat
  • <CM_NAME>: Gekoppelde Clusterbeheerder (CM)
  • < >CLUSTER_NAME: Naam van gekoppeld cluster
  • < >MISE_CID: Correlatie-id Microsoft.Identity.ServiceEssentials (MISE) in foutopsporingsuitvoer voor apparaatupdates
  • < >CORRELATION_ID: Correlatie-id van bewerking in foutopsporingsuitvoer voor apparaatupdates
  • < >ASYNC_URL: Asynchrone URL (ASYNC) in foutopsporingsuitvoer voor apparaatupdates

Implementatiegegevens

Details van implementatiegegevens
- Nexus: <NEXUS_VERSION>
- NC: <NC_VERSION>
- NF: <NF_VERSION>
- Subscription Name: <CUSTOMER_SUB_NAME>
- Subscription ID: <CUSTOMER_SUB_ID>
- Tenant ID: <CUSTOMER_SUB_TENANT_ID>

Informatie over foutopsporing voor Azure CLI-opdrachten

Foutopsporingsgegevens verzamelen voor Azure CLI-opdrachten

Azure CLI-implementatieopdrachten die zijn uitgegeven met --debug bevatten de volgende informatie in de opdrachtuitvoer:

cli.azure.cli.core.sdk.policies:     'mise-correlation-id': '<MISE_CID>'
cli.azure.cli.core.sdk.policies:     'x-ms-correlation-request-id': '<CORRELATION_ID>'
cli.azure.cli.core.sdk.policies:     'Azure-AsyncOperation': '<ASYNC_URL>'

Als u de status van langlopende asynchrone bewerkingen wilt weergeven, voert u de volgende opdracht uit met az rest:

az rest -m get -u '<ASYNC_URL>'

Informatie over de opdrachtstatus wordt, samen met gedetailleerde informatieve meldingen of foutmeldingen, geretourneerd.

  • "status": "Accepted"
  • "status": "Succeeded"
  • "status": "Failed"

Als er fouten optreden, meldt u de <MISE_CID>, <CORRELATION_ID>, statuscode en gedetailleerde berichten bij het openen van een ondersteuningsaanvraag.

Controles vooraf

Controles vooraf voordat u de Fabric-upgrade start
  1. De volgende rolmachtigingen moeten worden toegewezen aan eindgebruikers die verantwoordelijk zijn voor het maken, upgraden en verwijderen van Fabric.

    Deze machtigingen kunnen tijdelijk worden verleend, beperkt tot de duur die nodig is om de upgrade uit te voeren.

    • Microsoft.NexusIdentity/identitySets/read
    • Microsoft.NexusIdentity/identitySets/write
    • Microsoft.NexusIdentity/identitySets/delete
    • Zorg ervoor dat Role Based Access Control Administrator succesvol is geactiveerd.
    • Controleer Azure Portal via het volgende pad: Network Fabrics ->NF_NAME ->Access control (IAM) ->View my access.
    • In de huidige roltoewijzingen ziet u de volgende twee rollen:
      • Nexus-inzender
      • Op rollen gebaseerd toegangsbeheerbeheerder
  2. Valideer de inrichtingsstatus voor de Network Fabric Controller (NFC), Fabric en Fabric Devices.

    Meld u aan bij Azure CLI en selecteer of stel het <CUSTOMER_SUB_ID>volgende in:

    az login
    az account set --subscription <CUSTOMER_SUB_ID>
    

    Controleer of de NFC de status Geconfigureerd is:

    az networkfabric controller show -g <NFC_RG> --resource-name <NFC_NAME> --subscription <CUSTOMER_SUB_ID> -o table
    

    Controleer de NF-status:

    az networkfabric fabric show -g <NF_RG> --resource-name <NF_NAME> --subscription <CUSTOMER_SUB_ID> -o table
    

    Noteer de fabricVersion en provisioningState.

    Controleer de status van de apparaten.

    az networkfabric device list -g <NF_RG> -o table --subscription <CUSTOMER_SUB_ID>
    

    Opmerking

    Als provisioningState niet Succeeded is, stop dan de upgrade totdat de problemen zijn opgelost.

  3. Controleer of Microsoft.NexusIdentity de gebruikersresourceprovider (RP) is geregistreerd voor het klantabonnement:

    az provider show --namespace Microsoft.NexusIdentity -o table --subscription <CUSTOMER_SUB_ID>
    Namespace                RegistrationPolicy    RegistrationState
    -----------------------  --------------------  -------------------
    Microsoft.NexusIdentity  RegistrationRequired  Registered
    

    Als dit niet is geregistreerd, voert u het volgende uit om te registreren:

    az provider register --namespace Microsoft.NexusIdentity --wait --subscription <CUSTOMER_SUB_ID>
    
    az provider show --namespace Microsoft.NexusIdentity -o table
    Namespace                RegistrationPolicy    RegistrationState
    -----------------------  --------------------  -------------------
    Microsoft.NexusIdentity  RegistrationRequired  Registered
    
  4. Minimaal beschikbare schijfruimte op elk apparaat moet meer dan 3,5 GB zijn voor een geslaagde upgrade van het apparaat.

    Controleer de beschikbare ruimte op elke Fabric-apparaten met behulp van de volgende Azure CLI-opdracht.

    az networkfabric device run-ro --resource-name <NF_DEVICE_NAME> --resource-group <NF_RG> --ro-command "dir flash" --subscription <CUSTOMER_SUB_ID> --debug
    

    Neem contact op met Microsoft Ondersteuning als er onvoldoende ruimte is om de upgrade uit te voeren. Gearchiveerde Extensible Operating System-installatiekopieën en ondersteuningsbundelbestanden kunnen in overleg met de ondersteuning worden verwijderd.

  5. Controleer het Network Packet Broker (NPB) van Fabric voor verweesde Network Taps in Azure portal.

    • Selecteer Network Fabrics onder Azure Services en selecteer vervolgens de <NF_NAME>.
    • Klik op de Resource group voor de Stof.
    • Filter in de lijst Resources op Network Packet Broker.
    • Klik op de Network Packet Broker naam in de lijst.
    • Klik op het tabblad Network Taps op het Overview scherm.
    • Alle Network Taps moet Succeeded voor Configuration State en Provisioning State.
    • Zoek naar taps met een rode X, en een status van Not Found, Failed, of Error.

    Opmerking

    Wanneer een van de taps de status Not Found, Failed, of Error aangeeft, stop de upgrade totdat de problemen zijn opgelost. Geef deze informatie op bij Microsoft-ondersteuning bij het openen van een ondersteuningsticket voor problemen met tikfunctionaliteit.

  6. Voer het Fabric kabelvalidatierapport uit en valideer de resultaten. Volg Kabels valideren voor Nexus Network Fabric om het rapport in te stellen en uit te voeren

    Opmerking

    Los eventuele verbindings- en kabelproblemen op voordat u doorgaat met de upgrade.

  7. Bekijk opmerkingen bij de release van Operator Nexus voor vereiste controles en configuratie-updates die niet in dit document zijn opgenomen.

Upgrade procedure

Details van de upgradeprocedure voor Fabric Runtime

Huidige Versie van Fabric-runtime controleren

De huidige runtimeversie van het cluster controleren.

az networkfabric fabric list -g <NF_RG> --query "[].{name:name,fabricVersion:fabricVersion,configurationState:configurationState,provisioningState:provisioningState}" -o table --subscription <CUSTOMER_SUB_ID>
az networkfabric fabric show -g <NF_RG> --resource-name <NF_NAME> --subscription <CUSTOMER_SUB_ID>

Fabric-upgrade initiëren

Start de upgrade met de volgende opdracht:

az networkfabric fabric upgrade -g <NF_RG> --resource-name <NF_NAME> --subscription <CUSTOMER_SUB_ID> --action start --version "5.0.0"
{}

Opmerking

De uitvoer {} geeft aan dat het upgrade-commando succesvol is uitgevoerd.

De Fabric-resourceprovider controleert of de versie-upgrade is toegestaan van de bestaande Fabric-versie naar de doelversie. Alleen N+1 primaire release-upgrades zijn toegestaan (bijvoorbeeld 4.0.0-5.0.0>).

Bij een geslaagde voltooiing wordt de Fabric-status in Under Maintenance geplaatst en wordt elke andere bewerking op de Fabric voorkomen.

Apparaatspecifieke werkstroom volgen

Nexus Network Fabric Racks bestaan uit de volgende typen apparaten:

  • CE-switches (Customer Edge)
  • Beheerswitches (MGMT)
  • Tor-switches (Top of Rack)
  • Network Packet Brokers (NPB)

Acht Rack-omgevingen hebben 30 apparaten:

  • Aggregaatrek - twee CE, twee NPB, twee MGMT-switches (zes apparaten)
  • Acht rekenrekken: elk rekenrek heeft twee TOR's en één MGMT-switch (24 apparaten)

Vier Rack-omgevingen hebben 17 apparaten:

  • Aggregaatrek - twee CE's, één NPB, twee MGMT-switches (vijf apparaten)
  • Vier rekenrekken: elk rekenrek heeft twee TOR's en één MGMT-switch (12 apparaten)

Belangrijk

De apparaten moeten worden bijgewerkt in de volgende specifieke volgorde om de netwerkservice tijdens de upgrade te onderhouden.

  1. Rekenrek oneven genummerde TOR-upgrade tegelijk.
  2. Rekenkast met een even nummer TOR-upgrade in parallel uitvoeren.
  3. MGMT-switches voor de computerracks worden samen parallel geüpgraded.
  4. Aggregate Rack CEs worden achtereenvolgens geüpgraded.

    Belangrijk

    Na elke CE-upgrade wacht u vijf minuten om ervoor te zorgen dat het herstelproces is voltooid voordat u verdergaat met de volgende CE

  5. Aggregate Rack NPBs upgraden een na de andere in serie.
  6. Aggregate Rack MGMT switches upgrade een na de andere in serie.

Opmerking

Wacht op een geslaagde upgrade op alle apparaten in een groep voordat u naar de volgende groep gaat.

Apparaatspecifieke upgrade volgen

Voer de volgende opdracht uit om de versie op elk apparaat bij te werken:

az networkfabric device upgrade --version <NF_VERSION> -g <NF_RG> --resource-name <NF_DEVICE_NAME> --subscription <CUSTOMER_SUB_ID> --debug

Als onderdeel van de upgrade worden de apparaten in de onderhoudsmodus geplaatst. Het apparaat leegt al het verkeer en stopt reclameroutes, zodat de verkeersstroom naar het apparaat stopt. Na voltooiing werkt de NNF-service (Nexus Network Fabric) de eigenschap Apparaatresourceversie bij naar de nieuwe versie.

Verzamel ASYNC-URL- en correlatie-id-informatie voor verdere probleemoplossing indien nodig.

cli.azure.cli.core.sdk.policies:     'mise-correlation-id': '<MISE_CID>'
cli.azure.cli.core.sdk.policies:     'x-ms-correlation-request-id': '<CORRELATION_ID>'
cli.azure.cli.core.sdk.policies:     'Azure-AsyncOperation': '<ASYNC_URL>'

Geef deze informatie op bij Microsoft Ondersteuning bij het openen van een ondersteuningsticket voor upgradeproblemen.

Nadat de apparaatupgrades zijn voltooid, moet u ervoor zorgen dat alle apparaten worden weergegeven met <NF_VERSION> door de volgende opdracht uit te voeren:

az networkfabric device list -g <NF_RG> --query "[].{name:name,version:version}" -o table --subscription <CUSTOMER_SUB_ID>

Upgrade van Network Fabric voltooien

Nadat alle apparaten zijn bijgewerkt, voert u de volgende opdracht uit om de netwerkinfrastructuur uit de onderhoudsstatus te halen.

az networkfabric fabric upgrade --action Complete --version <NF_VERSION> -g <NF_RG> --resource-name <NF_NAME> --debug --subscription <CUSTOMER_SUB_ID>

Problemen met apparaatupdates oplossen

  1. Verzamel eventuele fouten in de Azure CLI-uitvoer.
  2. Apparaatbewerkingsstatus verzamelen vanuit Azure Portal of Azure CLI.
  3. Maak een Azure-ondersteuningsaanvraag voor eventuele upgradefouten van apparaten en koppel eventuele fouten, samen met de ASYNC-URL, correlatie-id en de werkingsstatus van Fabric en Apparaten.

Activiteiten na de upgrade

Gedetailleerde stappen voor taken na de upgrade

Opmerkingen bij de release van Operator Nexus bekijken

Bekijk de opmerkingen bij de release van Operator Nexus voor alle versiespecifieke acties die na de upgrade zijn vereist.

Nexus-exemplaar valideren

Valideer de gezondheid en status van alle resources van het Nexus-exemplaar met de Nexus Instance Readiness Test (IRT).

Als u IRT niet gebruikt, voert u resourcevalidatie uit van alle Nexus Instance-onderdelen met Azure CLI:

# Check `ProvisioningState = Succeeded` in all resources

# NFC
az networkfabric controller list -g <NFC_RG> --subscription <CUSTOMER_SUB_ID> -o table
az customlocation list -g <NFC_MRG> --subscription <CUSTOMER_SUB_ID> -o table

# Fabric
az networkfabric fabric list -g <NF_RG> --subscription <CUSTOMER_SUB_ID> -o table
az networkfabric rack list -g <NF_RG> --subscription <CUSTOMER_SUB_ID> -o table
az networkfabric fabric device list -g <NF_RG> --subscription <CUSTOMER_SUB_ID> -o table
az networkfabric nni list -g <NF_RG> --fabric <NF_NAME> --subscription <CUSTOMER_SUB_ID> -o table
az networkfabric acl list -g <NF_RG> --fabric <NF_NAME> --subscription <CUSTOMER_SUB_ID> -o table
az networkfabric l2domain list -g <NF_RG> --fabric <NF_NAME> --subscription <CUSTOMER_SUB_ID> -o table

# CM
az networkcloud clustermanager list -g <CM_RG> --subscription <CUSTOMER_SUB_ID> -o table

# Cluster
az networkcloud cluster list -g <CLUSTER_RG> --subscription <CUSTOMER_SUB_ID> -o table
az networkcloud baremetalmachine list -g <CLUSTER_MRG> --subscription <CUSTOMER_SUB_ID> --query "sort_by([]. {name:name,kubernetesNodeName:kubernetesNodeName,location:location,readyState:readyState,provisioningState:provisioningState,detailedStatus:detailedStatus,detailedStatusMessage:detailedStatusMessage,cordonStatus:cordonStatus,powerState:powerState,machineRoles:machineRoles| join(', ', @),createdAt:systemData.createdAt}, &name)" -o table
az networkcloud storageappliance list -g <CLUSTER_MRG> --subscription <CUSTOMER_SUB_ID> -o table

# Tenant Workloads
az networkcloud virtualmachine list --sub <CUSTOMER_SUB_ID> --query "reverse(sort_by([?clusterId=='<CLUSTER_RID>'].{name:name, createdAt:systemData.createdAt, resourceGroup:resourceGroup, powerState:powerState, provisioningState:provisioningState, detailedStatus:detailedStatus,bareMetalMachineId:bareMetalMachineIdi,CPUCount:cpuCores, EmulatorStatus:isolateEmulatorThread}, &createdAt))" -o table
az networkcloud kubernetescluster list --sub <CUSTOMER_SUB_ID> --query "[?clusterId=='<CLUSTER_RID>'].{name:name, resourceGroup:resourceGroup, provisioningState:provisioningState, detailedStatus:detailedStatus, detailedStatusMessage:detailedStatusMessage, createdAt:systemData.createdAt, kubernetesVersion:kubernetesVersion}" -o table

Opmerking

IRT-validatie biedt een volledige functionele test van netwerken en workloads voor alle onderdelen van het Nexus-exemplaar. Eenvoudige validatie biedt geen functionele tests.

Referentielinks voor stofupgrade

Naslagkoppelingen voor fabric-upgrade: