Delen via


Een cluster maken en inrichten met behulp van Azure CLI

In dit artikel wordt beschreven hoe u een cluster maakt met behulp van de Azure-opdrachtregelinterface (AzCLI). In dit document ziet u ook hoe u de status controleert, een cluster bijwerkt of verwijdert.

Vereisten

  • Controleer of Network Fabric Controller en Cluster Manager aanwezig zijn in uw Azure-regio
  • Controleer of het netwerkfabric succesvol is ingericht

API-handleiding en metrische gegevens

De API-handleiding bevat informatie over de resourceproviders en resourcemodellen en de API's.

De metrische gegevens die zijn gegenereerd op basis van de logboekgegevens zijn beschikbaar in metrische gegevens van Azure Monitor.

Beperkingen

  • Naamgeving - Naamgevingsregels vindt u hier.

Een cluster maken

De infrastructuurclusterresource vertegenwoordigt een on-premises implementatie van het platform in Clusterbeheer. Alle andere platformspecifieke resources zijn ervan afhankelijk voor hun levenscyclus.

Maak de netwerkinfrastructuur vóór deze on-premises implementatie. Elke Operator Nexus-instantie op locatie heeft een een-op-een-koppeling met een netwerkinfrastructuur.

Belangrijk

Er is een bekend probleem waarbij het bijwerken van een cluster onmiddellijk na het maken van het cluster fouten kan veroorzaken bij de implementatie van het cluster. Het probleem treedt op wanneer de resource wordt bijgewerkt voordat de velden bmcConnectionString worden ingevuld in de sectie cluster.spec.computeRackDefinitions.bareMetalMachineConfigurationData. De bmcConnectionStrings worden normaal gesproken binnen een paar minuten na het maken van het cluster ingesteld.

Om dit probleem te voorkomen, moet u ervoor zorgen dat de bmcConnectionStrings niet-lege waarden bevatten voordat u de clusterresource bijwerkt via het Azure-portal of de az networkcloud update opdracht.

Als u de status wilt bevestigen, opent u de JSON-eigenschappen voor de clusterresource (Operator Nexus) in Azure Portal of voert u een az networkcloud cluster show CLI-opdracht uit, zoals wordt weergegeven in het volgende voorbeeld. Als de waarden van bmmConnectionString niet-lege redfish+https.. waarden tonen, is het veilig om het cluster bij te werken. Dit probleem wordt opgelost in een toekomstige release.

Voorbeeld van bmcConnectionString-uitvoer voor az networkcloud cluster show -n cluster01 -g cluster01resourceGroup--query 'computeRackDefinitions[].bareMetalMachineConfigurationData[].bmcConnectionString' -o json is als volgt:

["redfish+https://10.9.3.20/redfish/v1/Systems/System.Embedded.1",
"redfish+https://10.9.3.19/redfish/v1/Systems/System.Embedded.1",
"redfish+https://10.9.3.18/redfish/v1/Systems/System.Embedded.1",
"redfish+https://10.9.3.17/redfish/v1/Systems/System.Embedded.1"]

Maak het cluster met behulp van Azure CLI - één opslagapparaat:

Belangrijk

Met deze opdracht maakt u het cluster voor een Nexus-exemplaar dat één opslagapparaat bevat. Als u het uitvoert op een exemplaar met twee opslagapparaten, wordt het tweede apparaat niet geconfigureerd. Volg de instructies voor meerdere opslagapparaten als uw Nexus-exemplaar twee opslagapparaten bevat.

az networkcloud cluster create --name "<CLUSTER_NAME>" --location "<LOCATION>" \
  --extended-location name="<CL_NAME>" type="CustomLocation" \
  --resource-group "<CLUSTER_RG>" \
  --analytics-workspace-id "<LAW_ID>" \
  --cluster-location "<CLUSTER_LOCATION>" \
  --network-rack-id "<AGGR_RACK_RESOURCE_ID>" \
  --rack-sku-id "<AGGR_RACK_SKU>"\
  --rack-serial-number "<AGGR_RACK_SN>" \
  --rack-location "<AGGR_RACK_LOCATION>" \
  --bare-metal-machine-configuration-data "["<AGGR_RACK_BMM>"]" \
  --storage-appliance-configuration-data '[{"adminCredentials":{"password":"<SA1_PASS>","username":"<SA_USER>"},"rackSlot":1,"serialNumber":"<SA1_SN>","storageApplianceName":"<SA1_NAME>"}]' \
  --compute-rack-definitions '[{"networkRackId": "<COMPX_RACK_RESOURCE_ID>", "rackSkuId": "<COMPX_RACK_SKU>", "rackSerialNumber": "<COMPX_RACK_SN>", "rackLocation": "<COMPX_RACK_LOCATION>", "storageApplianceConfigurationData": [], "bareMetalMachineConfigurationData":[{"bmcCredentials": {"password":"<COMPX_SVRY_BMC_PASS>", "username":"<COMPX_SVRY_BMC_USER>"}, "bmcMacAddress":"<COMPX_SVRY_BMC_MAC>", "bootMacAddress":"<COMPX_SVRY_BOOT_MAC>", "machineDetails":"<COMPX_SVRY_SERVER_DETAILS>", "machineName":"<COMPX_SVRY_SERVER_NAME>"}]}]'\
  --managed-resource-group-configuration name="<MRG_NAME>" location="<MRG_LOCATION>" \
  --network fabric-id "<NF_ID>" \
  --cluster-service-principal application-id="<SP_APP_ID>" \
    password="$SP_PASS" principal-id="$SP_ID" tenant-id="<TENANT_ID>" \
  --subscription "<SUBSCRIPTION_ID>" \
  --secret-archive-settings "{identity-type:<ID_TYPE>, vault-uri:<VAULT_URI>}" \
  --cluster-type "<CLUSTER_TYPE>" --cluster-version "<CLUSTER_VERSION>" \
  --tags <TAG_KEY1>="<TAG_VALUE1>" <TAG_KEY2>="<TAG_VALUE2>"

Maak het cluster met behulp van Azure CLI - meerdere opslagapparaten:

'<AGGR_RACK_SKU>' moet worden ingesteld op een waarde die ondersteuning biedt voor twee opslagapparaten. Zie Operator Nexus Network Cloud-SKU's om een geschikte SKU te kiezen. Met de opdracht voor het maken van het cluster wordt ook het standaardopslagapparaat ingesteld voor de creatie van volumes. Het standaardapparaat is het apparaat met "rackSlot":1 in de configuratiegegevens.

az networkcloud cluster create --name "<CLUSTER_NAME>" --location "<LOCATION>" \
  --extended-location name="<CL_NAME>" type="CustomLocation" \
  --resource-group "<CLUSTER_RG>" \
  --analytics-workspace-id "<LAW_ID>" \
  --cluster-location "<CLUSTER_LOCATION>" \
  --network-rack-id "<AGGR_RACK_RESOURCE_ID>" \
  --rack-sku-id "<AGGR_RACK_SKU>"\
  --rack-serial-number "<AGGR_RACK_SN>" \
  --rack-location "<AGGR_RACK_LOCATION>" \
  --bare-metal-machine-configuration-data "["<AGGR_RACK_BMM>"]" \
  --storage-appliance-configuration-data '[{"adminCredentials":{"password":"<SA1_PASS>","username":"<SA_USER>"},"rackSlot":1,"serialNumber":"<SA1_SN>","storageApplianceName":"<SA1_NAME>"},{"adminCredentials":{"password":"<SA2_PASS>","username":"<SA_USER>"},"rackSlot":2,"serialNumber":"<SA2_SN>","storageApplianceName":"<SA2_NAME>"}]' \
  --compute-rack-definitions '[{"networkRackId": "<COMPX_RACK_RESOURCE_ID>", "rackSkuId": "<COMPX_RACK_SKU>", "rackSerialNumber": "<COMPX_RACK_SN>", "rackLocation": "<COMPX_RACK_LOCATION>", "storageApplianceConfigurationData": [], "bareMetalMachineConfigurationData":[{"bmcCredentials": {"password":"<COMPX_SVRY_BMC_PASS>", "username":"<COMPX_SVRY_BMC_USER>"}, "bmcMacAddress":"<COMPX_SVRY_BMC_MAC>", "bootMacAddress":"<COMPX_SVRY_BOOT_MAC>", "machineDetails":"<COMPX_SVRY_SERVER_DETAILS>", "machineName":"<COMPX_SVRY_SERVER_NAME>"}]}]'\
  --managed-resource-group-configuration name="<MRG_NAME>" location="<MRG_LOCATION>" \
  --network fabric-id "<NF_ID>" \
  --cluster-service-principal application-id="<SP_APP_ID>" \
    password="$SP_PASS" principal-id="$SP_ID" tenant-id="<TENANT_ID>" \
  --subscription "<SUBSCRIPTION_ID>" \
  --secret-archive-settings "{identity-type:<ID_TYPE>, vault-uri:<VAULT_URI>}" \
  --cluster-type "<CLUSTER_TYPE>" --cluster-version "<CLUSTER_VERSION>" \
  --tags <TAG_KEY1>="<TAG_VALUE1>" <TAG_KEY2>="<TAG_VALUE2>"

Parameters voor clusterbewerkingen

Parameternaam Beschrijving
CLUSTER_NAAM Resourcenaam van het cluster
LOCATIE De Azure-regio waar het cluster wordt geïmplementeerd
CL_NAME De aangepaste locatie van Clusterbeheer vanuit De Azure-portal
CLUSTER_RG De naam van de clusterresourcegroep
LAW_ID Log Analytics-werkruimte-id voor het cluster
clusterlocatie De lokale naam van het cluster
AGGR_RACK_RESOURCE_ID RackID voor Aggregator Rack
AGGR_RACK_SKU De Rack Stock Keeping Unit (SKU) voor Aggregator Rack *Zie Operator Nexus Network Cloud-SKU's
AGGR_RACK_SN Serienummer van rack voor Aggregator Rack
AGGR_REKKEN_LOCATIE Fysieke locatie van rack voor Aggregator Rack
AGGR_RACK_BMM Enkel gebruikt voor implementatie met één rek, niet gebruikt voor multi-rack
SA1_NAME First Storage Appliance Apparatennaam
SA2_NAME Tweede Opslagapparaatapparaat Naam
SA1_PASS Eerste Storage Appliance beheerderswachtwoord referentie-URI of wachtwoordwaarde *Zie Key Vault Credential Reference
SA2_PASS Tweede opslagapparaat admin wachtwoord referentie URI of wachtwoordwaarde *Zie Key Vault Credential Reference
SA_USER Beheerder van opslagapparaat
SA1_SN Serienummer van eerste opslagapparaat
SA2_SN Serienummer van het tweede opslagapparaat
COMPX_RACK_RESOURCE_ID RackID voor CompX Rack, herhaal voor elk rek in de compute-rack-definities.
COMPX_RACK_SKU De Rack Stock Keeping Unit (SKU) voor CompX Rack; herhaal voor elk rek in compute-rack-definities *Zie Operator Nexus Network Cloud Stock Keeping Unit (SKU's)
COMPX_RACK_SN Serienummer voor elk rek in CompX Rack; herhaal voor elke rek in compute-rack-definitions
COMPX_RACK_LOCATION Fysieke locatie van rek voor CompX Rack; herhalen voor elk rek in compute-rack-definities
COMPX_SVRY_BMC_PASS CompX Rack Servery Baseboard Management Controller (BMC) wachtwoordreferentie URI of wachtwoordwaarde; herhaal dit voor elk rek in compute-rack-definities en voor elke server in rack *Zie Referentiereferentie voor Key Vault
COMPX_SVRY_BMC_USER CompX Rack ServerY BMC-gebruiker; herhaal voor elk rek in compute-rack-definities en voor elke server in het rek
COMPX_SVRY_BMC_MAC CompX Rack ServerY BMC MAC-adres; herhaal voor elk rek in compute-rack-definities en voor elke server in het rek
COMPX_SVRY_BOOT_MAC CompX Rack ServerY boot Network Interface Card (NIC) MAC-adres; herhaal voor elk rek in compute-rack-definities en voor elke server in het rek
COMPX_SVRY_SERVER_DETAILS Details van CompX Rack ServerY; herhaal voor elk rek in compute-rack-definities en voor elke server in rek
COMPX_SVRY_SERVER_NAME CompX Rack ServerY-naam; herhalen voor elk rek in compute-rack-definities en voor elke server in het rek
MRG_NAME Naam van beheerde clusterresourcegroep
MRG_LOCATION Azure-regio voor clusters
NF_ID Verwijzing naar Network Fabric
SP_APP_ID App-ID van Service Principal
SP_PASS Wachtwoord voor service-hoofdaccount
SP_ID Serviceprincipe-ID
TENANT_ID Abonnementtenant-ID
ABONNEMENT_ID Abonnements-id
KV_RESOURCE_ID Key Vault-id
CLUSTER_TYPE Type cluster, enkel of multirack
CLUSTER_VERSIE Netwerkcloudversie (NC) van cluster
TAG_KEY1 Optionele tag 1 die moet worden doorgegeven aan Cluster Create
TAG_VALUE1 Optionele tag1-waarde die moet worden doorgegeven aan Cluster Create.
TAG_KEY2 Optionele tag2 om door te geven aan Clustercreatie
TAG_VALUE2 Optionele tag2-waarde die moet worden doorgegeven aan Cluster Create
ID_TYPE Zie voor meer informatie over instellingen voor geheime archivering Clusterondersteuning voor beheerde identiteiten.
VAULT_URI Zie voor meer informatie over instellingen voor geheime archivering Clusterondersteuning voor beheerde identiteiten.

Clusteridentiteit

Na de release van de 2024-07-01 API-versie kan een klant beheerde identiteit toewijzen aan een cluster. Zowel door het systeem toegewezen als door de gebruiker toegewezen beheerde identiteiten worden ondersteund.

Zodra de identiteit is toegevoegd, kan de identiteit alleen worden verwijderd via de API-aanroep.

Zie Azure Operator Nexus Cluster Support for Managed Identities and User Provided Resourcesvoor meer informatie over beheerde identiteiten voor Operator Nexus Clusters.

Het cluster maken met behulp van azure Resource Manager-sjablooneditor

Een alternatieve manier om een cluster te maken is met de ARM-sjablooneditor.

Als u het cluster op deze manier wilt maken, moet u een sjabloonbestand (cluster.jsonc) en een parameterbestand (cluster.parameters.jsonc) opgeven. U vindt voorbeelden voor een 8-Rack 2M16C SKU-cluster met behulp van deze twee bestanden:

cluster.jsonc , cluster.parameters.jsonc

Notitie

Als u de juiste opmaak wilt ophalen, kopieert u het onbewerkte codebestand. De waarden in het bestand cluster.parameters.jsonc zijn klantspecifiek en zijn mogelijk geen volledige lijst. Werk de waardevelden voor uw specifieke omgeving bij.

  1. Navigeer naar Azure Portal in een webbrowser en meld u aan.
  2. Zoek in de zoekbalk van Azure Portal naar Een aangepaste sjabloon implementeren en selecteer deze vervolgens in de beschikbare services.
  3. Klik op Uw eigen sjabloon maken in de editor.
  4. Klik op 'Bestand laden'. Zoek het sjabloonbestand cluster.jsonc en upload het.
  5. Klik op Opslaan.
  6. Klik op Parameters bewerken.
  7. Klik op bestand laden. Zoek het parameterbestand cluster.parameters.jsonc en upload het.
  8. Klik op Opslaan.
  9. Selecteer het juiste abonnement.
  10. Zoek naar de resourcegroep om te zien of deze al bestaat. Als dat niet het geval is, maak een nieuwe resourcegroep aan.
  11. Zorg ervoor dat alle instantiedetails juist zijn.
  12. Klik op Beoordelen + maken.

Clustervalidatie

Het maken van een Operator Nexus-cluster resulteert in het maken van een Azure-resource in uw abonnement. De cluster-id, de inrichtingsstatus van het cluster en de implementatiestatus worden geretourneerd als gevolg van een geslaagde cluster createimplementatie.

De status van het cluster weergeven:

az networkcloud cluster show --cluster-name "<clusterName>" /
--resource-group "<resourceGroupName>" /
--subscription <subscriptionID>

Het maken van het cluster is voltooid wanneer de provisioningState bron het volgende toont: "provisioningState": "Succeeded"

Logboeken van de cluster

Logboeken voor het maken van clusters kunnen worden weergegeven op de volgende locaties:

  1. Azure Portal Resource/ResourceGroup-activiteitenlogboeken.
  2. Azure CLI met --debug vlag doorgegeven aan de opdrachtregel.

Drempelwaarde voor rekenimplementatie instellen

De drempelwaarde voor de toegestane fouten van rekenknooppunten tijdens de hardwarevalidatie wordt ingesteld met behulp van de compute-deployment-threshold parameter.

Als compute-deployment-threshold niet is ingesteld, zijn de standaardwaarden als volgt:

      "strategyType": "Rack",
      "thresholdType": "PercentSuccess",
      "thresholdValue": 80,
      "waitTimeMinutes": 1

Als een compute-deployment-threshold verschillende waarde dan de standaard van 80% vereist is, voert u het volgende cluster update commando uit.

Een klant die bijvoorbeeld het type PercentSuccess aanvraagt met een slagingspercentage van 97%:

az networkcloud cluster update --name "<clusterName>" /
--resource-group "<resourceGroup>" /
--compute-deployment-threshold type="PercentSuccess" grouping="PerCluster" value=97 /
--subscription <subscriptionID>

Update valideren

az networkcloud cluster show --resource-group "<resourceGroup>" --name "<clusterName>" | grep -a3 computeDeploymentThreshold

  "clusterType": "MultiRack",
  "clusterVersion": "<CLUSTER_VERSION>",
  "computeDeploymentThreshold": {
    "grouping": "PerCluster",
    "type": "PercentSuccess",
    "value": 97

In dit voorbeeld mislukt de clusterimplementatie als minder dan 97% van de rekenknooppunten die worden geïmplementeerd, hardwarevalidatie doorstaan. OPMERKING: Alle kubernetes-besturingsvlak (KCP) en nexus-beheervlak (NMP) moeten hardwarevalidatie doorgeven. Als 97% of meer van de rekenknooppunten die worden geïmplementeerd voldoen aan de hardwarevalidatie, gaat de clusterimplementatie door naar de bootstrap-provisioneringsfase.

Notitie

Implementatiedrempels kunnen niet worden gewijzigd nadat de clusterimplementatie is gestart.

Cluster implementeren

Belangrijk

Als best practice wacht u 20 minuten nadat u een cluster hebt gemaakt voordat u implementeert om ervoor te zorgen dat alle gekoppelde resources worden gemaakt.

De actie Cluster implementeren kan worden geactiveerd nadat het cluster is gemaakt. De actie Cluster uitrollen maakt de bootstrap-kopie en zet het cluster in.

Cluster implementeren initieert een reeks gebeurtenissen die plaatsvinden in Clusterbeheer.

  1. Validatie van de cluster-/rackeigenschappen.
  2. Generatie van een opstartbare installatiekopie voor het tijdelijke bootstrapcluster (Validatie van infrastructuur).
  3. Interactie met de IPMI-interface (Intelligent Platform Management Interface) van de doelgerichte bootstrap-machine.
  4. Hardwarevalidatiecontroles uitvoeren.
  5. Bewaking van het clusterimplementatieproces.

Het on-premises cluster implementeren:

az networkcloud cluster deploy \
  --name "$CLUSTER_NAME" \
  --resource-group "$CLUSTER_RG" \
  --subscription "$SUBSCRIPTION_ID" \
  --no-wait --debug

Advies

Als u de status van de az networkcloud cluster deploy opdracht wilt controleren, kan deze worden uitgevoerd met behulp van de --debug vlag. Haal de Azure-AsyncOperation of Location header op die wordt gebruikt om een query uit te voeren op de operationStatuses resource uit de uitvoer voor foutopsporing. Zie de sectie Cluster implementeren is mislukt voor gedetailleerdere stappen. Desgewenst kan de opdracht asynchroon worden uitgevoerd met behulp van de --no-wait vlag.

Clusterimplementatie met hardwarevalidatie

Tijdens een cluster-implementatieproces is een van de stappen die worden uitgevoerd hardwarevalidatie. De hardwarevalidatieprocedure voert verschillende tests uit en controleert op de machines die zijn opgegeven via de rackdefinitie van het cluster. Op basis van de resultaten van deze controles en eventuele door de gebruiker overgeslagen machines wordt een bepaling uitgevoerd over of er voldoende knooppunten zijn doorgegeven en/of beschikbaar zijn om te voldoen aan de drempelwaarden die nodig zijn om door te gaan met de implementatie.

Belangrijk

Het hardwarevalidatieproces schrijft de resultaten naar de opgegeven analyticsWorkspaceId bij het maken van een cluster. Daarnaast wordt de opgegeven service-principal in het clusterobject gebruikt voor verificatie met de Log Analytics Workspace Data Collection-API. Deze mogelijkheid is alleen zichtbaar tijdens een nieuwe implementatie (Groen veld); de logboeken zijn niet met terugwerkende kracht beschikbaar.

Notitie

De RAID-controller wordt opnieuw ingesteld tijdens de clusterimplementatie, waarbij alle gegevens van de virtuele schijven van de server worden verwijderd. Alle BMC-waarschuwingen (Baseboard Management Controller) voor virtuele schijven kunnen worden genegeerd, tenzij er andere waarschuwingen voor fysieke schijven en/of RAID-controllers zijn.

Standaard schrijft het hardwarevalidatieproces de resultaten naar het geconfigureerde cluster analyticsWorkspaceId. Vanwege de aard van gegevensverzameling en schema-evaluatie van Log Analytics-werkruimte kan er echter sprake zijn van opnamevertraging die enkele minuten of langer kan duren. Daarom wordt de clusterimplementatie voortgezet, zelfs als er een fout is opgetreden bij het schrijven van de resultaten naar de Log Analytics-werkruimte. Om deze mogelijke gebeurtenis te verhelpen, worden de resultaten voor redundantie ook geregistreerd in Clusterbeheer.

In de Log Analytics-werkruimte van het opgegeven clusterobject zou een nieuwe aangepaste tabel moeten verschijnen met de naam van het Cluster als voorvoegsel en het achtervoegsel *_CL. In de sectie Logboeken van de LAW-resource kan een query worden uitgevoerd op basis van de nieuwe *_CL aangepaste logboektabel.

Clusterimplementatie met het uitsluiten van specifieke bare-metal machines

De --skip-validation-for-machines parameter vertegenwoordigt de namen van bare-metalcomputers in het cluster die moeten worden overgeslagen tijdens hardwarevalidatie. Knooppunten die worden overgeslagen, worden niet gevalideerd en niet toegevoegd aan de knooppuntenpool. Bovendien tellen knooppunten die worden overgeslagen, niet mee voor het totaal dat wordt gebruikt door drempelwaardeberekeningen.

az networkcloud cluster deploy \
  --name "$CLUSTER_NAME" \
  --resource-group "$CLUSTER_RG" \
  --subscription "$SUBSCRIPTION_ID" \
  --skip-validations-for-machines "$COMPX_SVRY_SERVER_NAME"

De clusterimplementatie is mislukt

Belangrijk

Als een cluster de Failed status heeft, moet het worden verwijderd en opnieuw worden gemaakt voordat het opnieuw kan worden geïmplementeerd. Clusterfouten kunnen optreden wanneer niet aan de drempelwaarde voor hardwarevalidatie wordt voldaan, of een fase van de implementatie kan pas worden voltooid als het cluster de Running status heeft.

Als u de status van een asynchrone bewerking wilt bijhouden, voert u deze uit met een --debug vlag ingeschakeld. Wanneer --debug dit is opgegeven, kan de voortgang van de aanvraag worden bewaakt. De URL van de bewerkingsstatus vindt u door de debuguitvoer te bekijken en te zoeken naar de Azure-AsyncOperation of Location header in het HTTP-antwoord op het verzoek tot aanmaken. De headers kunnen het OPERATION_ID veld opgeven dat wordt gebruikt in de HTTP-API-aanroep.

OPERATION_ID="aaaa0a0a-bb1b-cc2c-dd3d-eeeeee4e4e4e*99399E995..."
az rest -m GET -u "https://management.azure.com/subscriptions/${SUBSCRIPTION_ID}/providers/Microsoft.NetworkCloud/locations/${LOCATION}/operationStatuses/${OPERATION_ID}?api-version=2022-12-12-preview"

De uitvoer is vergelijkbaar met het voorbeeld van de JSON-struct. Wanneer de foutcode isHardwareValidationThresholdFailed, bevat het foutbericht een lijst met bare-metalcomputers waarvoor de hardwarevalidatie is mislukt (bijvoorbeeld COMP0_SVR0_SERVER_NAME). COMP1_SVR1_SERVER_NAME Deze namen kunnen worden gebruikt om de logboeken te parseren voor meer informatie.

{
  "endTime": "2023-03-24T14:56:59.0510455Z",
  "error": {
    "code": "HardwareValidationThresholdFailed",
    "message": "HardwareValidationThresholdFailed error hardware validation threshold for cluster layout plan is not met for cluster $CLUSTER_NAME in namespace nc-system with listed failed devices $COMP0_SVR0_SERVER_NAME, $COMP1_SVR1_SERVER_NAME"
  },
  "id": "/subscriptions/$SUBSCRIPTION_ID/providers/Microsoft.NetworkCloud/locations/$LOCATION/operationStatuses/aaaa0a0a-bb1b-cc2c-dd3d-eeeeee4e4e4e*99399E995...",
  "name": "aaaa0a0a-bb1b-cc2c-dd3d-eeeeee4e4e4e*99399E995...",
  "resourceId": "/subscriptions/$SUBSCRIPTION_ID/resourceGroups/$CLUSTER_RESOURCE_GROUP/providers/Microsoft.NetworkCloud/clusters/$CLUSTER_NAME",
  "startTime": "2023-03-24T14:56:26.6442125Z",
  "status": "Failed"
}

Zie het artikel Asynchrone bewerkingen bijhouden met behulp van Azure CLI voor een ander voorbeeld. Zie Problemen met Bare Metal Machine (BMM) provisioning oplossen voor meer informatie over specifieke machinevalidatie- of implementatiefouten.

Validatie van clusterimplementatie

Bekijk de status van het cluster in de portal of via de Azure CLI:

az networkcloud cluster show --resource-group "$CLUSTER_RG" \
  --name "$CLUSTER_NAME"

De clusterimplementatie wordt uitgevoerd wanneer detailedStatus is ingesteld op Deploying en detailedStatusMessage geeft de voortgang van de implementatie weer.

Enkele voorbeelden van de voortgang van de implementatie die in detailStatusMessage worden weergegeven, zijn Hardware validation is in progress. (als het cluster is geïmplementeerd met hardwarevalidatie), Cluster is bootstrapping., KCP initialization in progress.Management plane deployment in progress., Cluster extension deployment in progress., , waiting for "<rack-ids>" to be readyenzovoort.

Schermopname van Azure Portal met de voortgang van de clusterimplementatie kcp init.

Schermopname van Azure Portal met toepassing voor de voortgang van clusterimplementatie.

De clusterimplementatie is voltooid wanneer detailedStatus is ingesteld op Running en detailedStatusMessage een bericht Cluster is up and runningweergeeft.

Schermopname van Azure Portal waarin de implementatie van het cluster is voltooid.

Bekijk de beheerversie van het cluster:

az k8s-extension list --cluster-name "$CLUSTER_NAME" --resource-group "$MRG_NAME" --cluster-type connectedClusters --query "[?name=='nc-platform-extension'].{name:name, extensionType:extensionType, releaseNamespace:scope.cluster.releaseNamespace,provisioningState:provisioningState,version:version}" -o table --subscription "$SUBSCRIPTION_ID"

Logboekregistratie van clusterimplementatie

Logboeken voor het maken van clusters kunnen worden weergegeven op de volgende locaties:

  1. Azure Portal Resource/ResourceGroup-activiteitenlogboeken.
  2. Azure CLI met --debug vlag doorgegeven aan de opdrachtregel.

Schermopname van Azure Portal met het activiteitenlogboek voor de implementatie van het cluster.

Een cluster verwijderen

Als u een cluster verwijdert, worden de resources in Azure en het cluster verwijderd dat zich in de on-premises omgeving bevindt.

Belangrijk

Als er tenantbronnen aanwezig zijn in het cluster, mislukt het verwijderen totdat de tenantbronnen worden verwijderd.

Schermopname van de portal die de fout toont bij het verwijderen vanwege huurdersmiddelen.

az networkcloud cluster delete --name "$CLUSTER_NAME" --resource-group "$CLUSTER_RG"

Notitie

Als best practice wacht u 20 minuten nadat u een cluster hebt verwijderd voordat u een nieuw cluster probeert te maken met dezelfde naam om ervoor te zorgen dat alle gekoppelde resources worden verwijderd.