Bewerken

Delen via


Problemen en fouten oplossen tijdens een AKS Arc-installatie

Van toepassing op: AKS in Azure Stack HCI, AKS op Windows Server In dit artikel worden bekende problemen en fouten beschreven die kunnen optreden bij het installeren van AKS Arc. U kunt ook bekende problemen bekijken bij het upgraden van AKS Arc en bij het gebruik van het Windows-beheercentrum.

Fout 'Kan niet wachten op onboarding van addon arc'

Dit foutbericht wordt weergegeven na het uitvoeren van Install-AksHci.

Notitie

De fout kan worden veroorzaakt doordat Private Link is ingeschakeld voor de installatie. Er is momenteel geen tijdelijke oplossing voor dit scenario. AKS op HCI werkt niet met Private Link.

Als u Geen Private Link gebruikt, voert u de volgende stappen uit om dit probleem op te lossen:

  1. Open PowerShell en voer Uninstall-AksHci uit.
  2. Open Azure Portal en navigeer naar de resourcegroep die u hebt gebruikt bij het uitvoeren Install-AksHci.
  3. Controleer op verbonden clusterbronnen die worden weergegeven in de status Verbinding verbroken en neem een naam op die wordt weergegeven als een willekeurig gegenereerde GUID.
  4. Verwijder deze clusterbronnen.
  5. Sluit de PowerShell-sessie en open een nieuwe sessie voordat u deze opnieuw uitvoert Install-AksHci .

Fout: 'Install-AksHci Failed, Service heeft een fout geretourneerd. Status=403 Code="RequestDisallowedByPolicy"' fout bij het installeren van AKS-HCI

Deze fout kan worden veroorzaakt door het installatieproces dat probeert een Azure-beleid te schenden dat is ingesteld op het Azure-abonnement of de resourcegroep die is opgegeven tijdens het onboardingproces van Azure Arc. Deze fout kan optreden voor gebruikers die Azure-beleid hebben gedefinieerd op abonnements- of resourcegroepniveau en vervolgens proberen AKS te installeren op Azure Stack HCI die een Azure Policy schendt.

Als u dit probleem wilt oplossen, leest u het foutbericht om te begrijpen welke Azure Policy is ingesteld door uw Azure-beheerder en wijzigt u vervolgens het Azure-beleid door een uitzondering te maken op het Azure-beleid. Zie de uitzonderingsstructuur van Azure Policy voor meer informatie over beleidsonderzondering.

Fout: Install-AksHci is mislukt met fout - [Het object bestaat al] Er is een fout opgetreden tijdens het maken van resource 'IPv4 Address xxx.xx.xx.xx', voor de geclusterde rol 'xx-xxxxxxxx-xxxx-xxxx-xxxxxxxxx'

Een eerder geïnstalleerde functie heeft de status Mislukt en is niet verwijderd. Mogelijk ziet u de volgende fout:

Exception [An error occurred while creating resource 'MOC Cloud Agent Service' for the clustered role 'ca-3f72bdeb-xxxx-4ae9-a721-3aa902a998f0'.]
Stacktrace [at Add-FailoverClusterGenericRole, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Common.psm1: line 2987
at Install-CloudAgent, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1310
at Install-MocAgents, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1229
at Initialize-Cloud, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1135
at Install-MocInternal, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1078
at Install-Moc, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 207
at Install-AksHciInternal, C:\Program Files\WindowsPowerShell\Modules\AksHci\1.1.25\AksHci.psm1: line 3867
at Install-AksHci, C:\Program Files\WindowsPowerShell\Modules\AksHci\1.1.25\AksHci.psm1: line 778
at <ScriptBlock>, <No file>: line 1]
InnerException[The object already exists]

U kunt ook het volgende zien:

Install-Moc failed.
Exception [Unable to save property changes for 'IPv4 Address xxx.168.18.0'.]
Stacktrace [at Add-FailoverClusterGenericRole, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Common.psm1: line 2971
at Install-CloudAgent, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1310
at Install-MocAgents, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1229
at Initialize-Cloud, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1135
at Install-MocInternal, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1078
at Install-Moc, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 207
at Install-AksHciInternal, C:\Program Files\WindowsPowerShell\Modules\AksHci\1.1.25\AksHci.psm1: line 3867
at Install-AksHci, C:\Program Files\WindowsPowerShell\Modules\AksHci\1.1.25\AksHci.psm1: line 778
at <ScriptBlock>, <No file>: line 1]
InnerException[A matching cluster network for the specified IP address could not be found]

U kunt dit probleem oplossen door de clusterrol handmatig op te schonen. U kunt de resource verwijderen uit failoverclusterbeheer door de volgende PowerShell-cmdlet uit te voeren: Remove-ClusterResource -name <resource name>

Fout: "GetRelease error returned by API call: File download error: Hash mismatch"

De Install-AksHci cmdlet mislukt met de fout 'GetRelease geretourneerd door API-aanroep: Bestandsdownloadfout: Hash komt niet overeen'.

  1. Open PowerShell en voer het uit Uninstall-AksHci.
  2. Voer een installatie opnieuw uit.
  3. Als het probleem zich blijft voordoen, gebruikt u de -concurrentDownloads parameter met Set-AksHciConfig en stelt u deze in op een getal lager dan de standaardwaarde 10 voordat u een installatie opnieuw probeert uit te voeren. Het verminderen van het aantal gelijktijdige downloads kan ertoe bijdragen dat gevoelige netwerken grote bestandsdownloads voltooien. Deze parameter is een preview-functie.

Na het implementeren van AKS in Azure Stack HCI 21H2, heeft het opnieuw opstarten van de knooppunten een mislukte status voor facturering weergegeven

Na de implementatie, bij het opnieuw opstarten van de Azure Stack HCI-knooppunten, toont het AKS-rapport een mislukte status voor facturering.

Volg de instructies om het token handmatig te draaien en de KMS-invoegtoepassing opnieuw op te starten om dit probleem op te lossen.

Er is een time-out opgetreden bij Install-AksHci met de fout ''

Nadat Install-AksHci is uitgevoerd, is de installatie gestopt en wordt het volgende foutbericht weergegeven:

\kubectl.exe --kubeconfig=C:\AksHci\0.9.7.3\kubeconfig-clustergroup-management 
get akshciclusters -o json returned a non zero exit code 1 
[Unable to connect to the server: dial tcp 192.168.0.150:6443: 
connectex: A connection attempt failed because the connected party 
did not properly respond after a period of time, or established connection 
failed because connected host has failed to respond.]

Er zijn meerdere redenen waarom een installatie kan mislukken met de waiting for API server fout.

In de volgende sectie vindt u een overzicht van mogelijke oorzaken en oplossingen voor deze fout.

Reden 1: Onjuiste IP-gatewayconfiguratie Als u statische IP-adressen gebruikt en u het volgende foutbericht hebt ontvangen, controleert u of de configuratie voor het IP-adres en de gateway juist is.

Install-AksHci 
C:\AksHci\kvactl.exe create --configfile C:\AksHci\yaml\appliance.yaml  --outfile C:\AksHci\kubeconfig-clustergroup-management returned a non-zero exit code 1 [ ]

Voer de volgende opdracht uit om te controleren of u de juiste configuratie voor uw IP-adres en gateway hebt:

ipconfig /all

Bevestig de configuratie in de weergegeven configuratie-instellingen. U kunt ook proberen om de IP-gateway en DNS-server te pingen.

ping <DNS server>

Als deze methoden niet werken, gebruikt u New-AksHciNetworkSetting om de configuratie te wijzigen.

Reden 2: Onjuiste DNS-server Als u statische IP-adressen gebruikt, controleert u of de DNS-server juist is geconfigureerd. Gebruik de volgende opdracht om het DNS-serveradres van de host te controleren:

Get-NetIPConfiguration.DNSServer | ?{ $_.AddressFamily -ne 23} ).ServerAddresses

Controleer of het DNS-serveradres hetzelfde is als het adres dat wordt gebruikt bij het uitvoeren New-AksHciNetworkSetting van de volgende opdracht:

Get-MocConfig

Als de DNS-server onjuist is geconfigureerd, installeert u AKS opnieuw in Azure Stack HCI met de juiste DNS-server. Zie Opnieuw opstarten, verwijderen of opnieuw installeren van Azure Kubernetes Service in Azure Stack HCI voor meer informatie.

Het probleem is opgelost na het verwijderen van de configuratie en het opnieuw opstarten van de VM met een nieuwe configuratie.

Fout: 'Het proces heeft geen toegang tot het bestand 'mocstack.cab' omdat het wordt gebruikt door een ander proces'

Install-AksHci is mislukt met deze fout omdat een ander proces toegang heeft mocstack.cabtot .

U kunt dit probleem oplossen door alle geopende PowerShell-vensters te sluiten en vervolgens een nieuw PowerShell-venster te openen.

Fout: Install-AksHci mislukt met 'Install-MOC failed with the error- the process cannot access the file \<path> because it wordt used by another process.'

Het bestand kan niet worden gebruikt omdat het door een ander proces wordt gebruikt.

U kunt dit probleem oplossen door de PowerShell-sessie opnieuw te starten. Sluit het PowerShell-venster en probeer Install-AksHci opnieuw.

Fout: 'Er is een bestaande verbinding geforceerd gesloten door de externe host'

Install-AksHci is mislukt met deze fout omdat de IP-adresgroepen die zijn opgegeven in de AKS-configuratie in Azure Stack HCI met 1 in de CIDR zijn uitgeschakeld en cloudagent kan vastlopen. Als u bijvoorbeeld subnet 10.0.0.0/21 hebt met een adresbereik van 10.0.0.0 - 10.0.7.255 en u vervolgens een beginadres van 10.0.0.1 of een eindadres van 10.0.7.254 gebruikt, loopt CloudAgent vast.

U kunt dit probleem omzeilen door New-AksHciNetworkSetting uit te voeren en een ander geldig IP-adresbereik te gebruiken voor uw VIP-pool en Kubernetes-knooppuntgroep. Zorg ervoor dat de waarden die u gebruikt, niet zijn uitgeschakeld door 1 aan het begin of einde van het adresbereik.

Install-AksHci is mislukt bij een installatie met meerdere knooppunten met de fout 'Knooppunten hebben de actieve status niet bereikt'

Bij het uitvoeren van Install-AksHci op een installatie met één knooppunt werkte de installatie, maar bij het instellen van het failovercluster mislukt de installatie met het foutbericht. Bij het pingen van de cloudagent bleek echter dat cloudagent bereikbaar was.

Voer de volgende opdracht uit op elk knooppunt om ervoor te zorgen dat alle knooppunten de DNS van de CloudAgent kunnen oplossen:

Resolve-DnsName <FQDN of cloudagent>

Wanneer de bovenstaande stap op de knooppunten is geslaagd, moet u ervoor zorgen dat de knooppunten de CloudAgent-poort kunnen bereiken om te controleren of een proxy deze verbinding niet probeert te blokkeren en de poort is geopend. Voer hiervoor de volgende opdracht uit op elk knooppunt:

Test-NetConnection  <FQDN of cloudagent> -Port <Cloudagent port - default 65000>

Het AKS-downloadpakket op Azure Stack HCI mislukt met de fout: 'msft.sme.aks kan niet worden geladen'

De fout is het gevolg van een fout bij het downloaden.

Als u deze fout krijgt, moet u de nieuwste versie van Microsoft Edge of Google Chrome gebruiken en het opnieuw proberen.

Bij het uitvoeren van Set-AksHciRegistration wordt de fout 'Kan geregistreerde resourceproviders niet controleren' weergegeven

Deze fout wordt weergegeven na het uitvoeren van Set-AksHciRegistration in een AKS op Azure Stack HCI-installatie. De fout geeft aan dat de Kubernetes-resourceproviders niet zijn geregistreerd voor de tenant die momenteel is aangemeld.

Voer de Azure CLI of de Onderstaande PowerShell-stappen uit om dit probleem op te lossen:

az provider register --namespace Microsoft.Kubernetes
az provider register --namespace Microsoft.KubernetesConfiguration
Register-AzResourceProvider -ProviderNamespace Microsoft.Kubernetes
Register-AzResourceProvider -ProviderNamespace Microsoft.KubernetesConfiguration

Het duurt ongeveer 10 minuten om de registratie te voltooien. Gebruik de volgende opdrachten om het registratieproces te bewaken.

az provider show -n Microsoft.Kubernetes -o table
az provider show -n Microsoft.KubernetesConfiguration -o table
Get-AzResourceProvider -ProviderNamespace Microsoft.Kubernetes
Get-AzResourceProvider -ProviderNamespace Microsoft.KubernetesConfiguration

Install-AksHci loopt vast in de fase Wachten op azure-arc-onboarding om te voltooien voordat er een time-out optreedt

Notitie

Dit probleem is opgelost in de release van mei 2022 en hoger.

Install-AksHci loopt vast voordat Waiting for azure-arc-onboarding to complete er een time-out optreedt wanneer:

  • Een service-principal wordt gebruikt in AKS in Azure Stack HCI-registratie (Set-AksHciRegistration).
  • Az.Accounts PowerShell-modules versie(2.7.x) geïnstalleerd.

Az.Accounts 2.7.x versies verwijdert de ServicePrincipalSecret en CertificatePassword in PSAzureRmAccount, die wordt gebruikt door AKS in Azure Stack HCI voor onboarding van Azure Arc.

Om het volgende te reproduceren:

  1. Installeer Az.Accounts versie van PowerShell-modules (>= 2.7.0).
  2. Set-AksHciRegistration met behulp van een service-principal.
  3. Install-AksHci.

Verwacht gedrag:

  1. De AKS op Azure Stack HCI-installatie loopt vast bij Waiting for azure-arc-onboarding to complete.
  2. Azure-arc-onboarding pods gaan in de crashlus.
  3. De Azure-arc-onboarding pods-fout met de volgende fout:
    Starting onboarding process ERROR: variable CLIENT_SECRET is required

Ga als volgt te werk om het probleem op te lossen:

Verwijder Az.Accounts-modules met versie 2.7.x. voer de volgende cmdlet uit:

Uninstall-Module -Name Az.Accounts -RequiredVersion 2.7.0 -Force

Tijdens de installatie wordt deze fout weergegeven: 'Kan apparaat-VM niet maken: kan geen virtuele machine maken: rpc-fout = onbekend desc = Uitzondering is opgetreden. (Algemene fout)]'

Deze fout treedt op als Azure Stack HCI geen beleid heeft. De verbindingsstatus op het cluster kan aangeven dat deze is verbonden, maar in het gebeurtenislogboek wordt het waarschuwingsbericht weergegeven.Azure Stack HCI's subscription is expired, run Sync-AzureStackHCI to renew the subscription

U kunt deze fout oplossen door te controleren of het cluster is geregistreerd bij Azure met behulp van de Get-AzureStackHCI PowerShell-cmdlet die beschikbaar is op uw computer. Het Windows Admin Center-dashboard toont ook statusinformatie over de Azure-registratie van het cluster.

Als het cluster al is geregistreerd, moet u het veld LastConnected weergeven in de uitvoer van Get-AzureStackHCI. Als het veld laat zien dat het langer dan 30 dagen geleden is, moet u proberen de situatie op te lossen met behulp van de cmdlet Sync-AzureStackHCI.

U kunt ook controleren of elk knooppunt van uw cluster de vereiste licentie heeft met behulp van de volgende cmdlet:

Get-ClusterNode | % { Get-AzureStackHCISubscriptionStatus -ComputerName $_ }
Computer Name Subscription Name           Status   Valid To
------------- -----------------           ------   --------
MS-HCIv2-01   Azure Stack HCI             Active   12/23/2021 12:00:14 AM
MS-HCIv2-01   Windows Server Subscription Inactive

MS-HCIv2-02   Azure Stack HCI             Active   12/23/2021 12:00:14 AM
MS-HCIv2-02   Windows Server Subscription Inactive

MS-HCIv2-03   Azure Stack HCI             Active   12/23/2021 12:00:14 AM
MS-HCIv2-03   Windows Server Subscription Inactive

Als het probleem niet is opgelost nadat de Sync-AzureStackHCI cmdlet is uitgevoerd, neemt u contact op met Microsoft Ondersteuning.

Na een mislukte installatie werkt het uitvoeren van Install-AksHci niet

Dit probleem treedt op omdat een mislukte installatie kan leiden tot gelekte resources die moeten worden opgeschoond voordat u opnieuw kunt installeren.

Als de installatie mislukt met Install-AksHci, moet u Uninstall-AksHci uitvoeren voordat u het opnieuw uitvoertInstall-AksHci.

Fout: 'Kan virtueel netwerk niet afstemmen' of 'Fout: Install-Moc is mislukt met fout - Uitzondering [[Moc] Deze machine lijkt niet te zijn geconfigureerd voor implementatie]'

U kunt deze fouten activeren wanneer u deze uitvoert Install-AksHci zonder Set-AksHciConfig eerst uit te voeren.

Als u de fout wilt oplossen, voert u alle PowerShell-vensters uit uninstall-akshci en sluit u deze. Open een nieuwe PowerShell-sessie en start het AKS-HCI-installatieproces opnieuw door AKS-HCI te installeren met behulp van PowerShell.

Set-AksHciConfig mislukt met de fout 'GetCatalog-fout geretourneerd door API-aanroep: ... proxyconnect tcp: tls: eerste record ziet er niet uit als een TLS-handshake"

De Set-AksHciConfig PowerShell-cmdlet mislukt met de fout:

GetCatalog error returned by API call: ... proxyconnect tcp: tls: first record does not look like a TLS Handshake

Als u AKS gebruikt met een proxyserver, hebt u mogelijk de verkeerde URL gebruikt bij het instellen van de vereiste HTTPS-proxy-URL-waarde. De URL van de HTTP-proxy en de URL van de HTTPS-proxy zijn beide vereist bij het configureren van AKS met een proxyserver, maar het is gebruikelijk dat beide waarden nodig zijn om dezelfde HTTP-voorvoegsel-URL te delen.

Als dit mogelijk het geval is in uw omgeving, voert u de volgende risicobeperkingsstappen uit:

  1. Sluit het PowerShell-venster en open een nieuw venster.
  2. Voer de New-AksHciNetworkSetting en New-AksHciProxySetting cmdlets opnieuw uit. Wanneer u deze uitvoert New-AksHciProxySetting, stelt u de -https parameter in met dezelfde HTTP-voorvoegsel-URL-waarde die u hebt ingesteld voor -http.
  3. Voer de opdracht uit Set-AksHciConfig en ga door.

Wanneer u AKS implementeert in Azure Stack HCI met een onjuist geconfigureerd netwerk, treedt er een time-out op voor de implementatie op verschillende punten

Wanneer u AKS implementeert in Azure Stack HCI, kan er een time-out optreden voor de implementatie op verschillende tijdstippen van het proces, afhankelijk van waar de onjuiste configuratie is opgetreden. Bekijk het foutbericht om de oorzaak te bepalen en waar deze is opgetreden.

In de volgende fout bevindt zich bijvoorbeeld het punt waarop de onjuiste configuratie heeft plaatsgevonden Get-DownloadSdkRelease -Name "mocstack-stable":

$vnet = New-AksHciNetworkSettingSet-AksHciConfig -vnet $vnetInstall-AksHciVERBOSE: 
Initializing environmentVERBOSE: [AksHci] Importing ConfigurationVERBOSE: 
[AksHci] Importing Configuration Completedpowershell : 
GetRelease - error returned by API call: 
Post "https://msk8s.api.cdp.microsoft.com/api/v1.1/contents/default/namespaces/default/names/mocstack-stable/versions/0.9.7.0/files?action=generateDownloadInfo&ForegroundPriority=True": 
dial tcp 52.184.220.11:443: connectex: 
A connection attempt failed because the connected party did not properly
respond after a period of time, or established connection failed because
connected host has failed to respond.At line:1 char:1+ powershell -command
{ Get-DownloadSdkRelease -Name "mocstack-stable"}

Dit geeft aan dat het fysieke Azure Stack HCI-knooppunt de naam van de download-URL kan omzetten, msk8s.api.cdp.microsoft.commaar het knooppunt kan geen verbinding maken met de doelserver.

U kunt dit probleem oplossen door te bepalen waar de uitsplitsing is opgetreden in de verbindingsstroom. Hier volgen enkele stappen om het probleem van het fysieke clusterknooppunt op te lossen:

  1. Ping de DNS-naam van de bestemming: ping msk8s.api.cdp.microsoft.com.
  2. Als u een antwoord terug krijgt en er geen time-out optreedt, werkt het basisnetwerkpad.
  3. Als er een time-out optreedt voor de verbinding, kan er sprake zijn van een onderbreking in het gegevenspad. Zie Proxy-instellingen controleren voor meer informatie. Of er kan sprake zijn van een onderbreking in het retourpad, dus moet u de firewallregels controleren.

Set-AksHciConfig mislukt met WinRM-fouten, maar geeft aan dat WinRM correct is geconfigureerd

Bij het uitvoeren van Set-AksHciConfig kan de volgende fout optreden:

WinRM service is already running on this machine.
WinRM is already set up for remote management on this computer.
Powershell remoting to TK5-3WP08R0733 was not successful.
At C:\Program Files\WindowsPowerShell\Modules\Moc\0.2.23\Moc.psm1:2957 char:17
+ ...             throw "Powershell remoting to "+$env:computername+" was n ...
+                 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    + CategoryInfo          : OperationStopped: (Powershell remo...not successful.:String) [], RuntimeException
    + FullyQualifiedErrorId : Powershell remoting to TK5-3WP08R0733 was not successful.

Deze fout treedt meestal op als gevolg van een wijziging in het beveiligingstoken van de gebruiker (als gevolg van een wijziging in het groepslidmaatschap), een wachtwoordwijziging of een verlopen wachtwoord. In de meeste gevallen kan het probleem worden opgelost door u af te melden bij de computer en u opnieuw aan te melden. Als dit nog steeds mislukt, kunt u een probleem indienen bij GitHub AKS HCI-problemen.

Roulatie van moc-agentlogboek mislukt

Moc-agents worden verwacht alleen de laatste 100 agentlogboeken te bewaren. Ze moeten de oudere logboeken verwijderen. De logboekrotatie vindt echter niet plaats en logboeken blijven geaccumuleerde schijfruimte verbruiken.

Om het te reproduceren: Install AksHci en een cluster actief te hebben totdat het aantal agentlogboeken groter is dan 100. Op het moment dat het nde logboek wordt gemaakt, wordt verwacht dat de agents het n-100e logboek verwijderen, als ze bestaan.

Het probleem oplossen:

  1. Wijzig de logconf-bestanden van de cloudagent en knooppuntagenten. Logconfig van cloudagent bevindt zich op:
    (Get-MocConfig).cloudConfigLocation+"\log\logconf".
    Logconfig van knooppuntagent bevindt zich op:
    (Get-MocConfig).cloudConfigLocation+"\log\logconf".

  2. Wijzig de waarde van Limiet in 100 en Slots in 100 en sla de configuratiebestanden op.

  3. Start de cloudagent en knooppuntagenten opnieuw op om deze wijzigingen te registreren.

Met deze stappen wordt de logboekrotatie pas gestart nadat er 100 nieuwe logboeken zijn gegenereerd op basis van het opnieuw opstarten van de agent. Als er al n agentlogboeken zijn op het moment van opnieuw opstarten, wordt logboekrotatie pas gestart nadat n+100 logboeken zijn gegenereerd.

Cloudagent kan niet worden gestart bij het gebruik van padnamen met spaties erin

Wanneer u Set-AksHciConfig gebruikt om parameters op te geven-imageDir, -workingDir-cloudConfigLocationof -nodeConfigLocation parameters met een padnaam die een spatieteken bevat, zoalsD:\Cloud Share\AKS HCI, kan de cloudagentclusterservice niet beginnen met het volgende (of vergelijkbare) foutbericht:

Failed to start the cloud agent generic cluster service in failover cluster. The cluster resource group os in the 'failed' state. Resources in 'failed' or 'pending' states: 'MOC Cloud Agent Service'

Als u dit probleem wilt omzeilen, gebruikt u een pad dat geen spaties bevat, C:\CloudShare\AKS-HCIbijvoorbeeld.

Fout: 'Install-Moc is mislukt met fout - Uitzondering [CloudAgent is onbereikbaar. MOC CloudAgent kan om de volgende redenen niet bereikbaar zijn]'

Deze fout kan optreden wanneer de infrastructuur onjuist is geconfigureerd.

Voer de volgende stappen uit om deze fout op te lossen:

  1. Controleer de configuratie en gatewayinstellingen van de host-DNS-server:

    1. Controleer of de DNS-server juist is geconfigureerd. Voer de volgende opdracht uit om het DNS-serveradres van de host te controleren:
      ((Get-NetIPConfiguration).DNSServer | ?{ $_.AddressFamily -ne 23}).ServerAddresses
      
    2. Voer de opdracht ipconfig/alluit om te controleren of uw IP-adres en gatewayconfiguratie juist zijn.
    3. Probeer de IP-gateway en de DNS-server te pingen.
  2. Controleer de CloudAgent-service om te controleren of deze wordt uitgevoerd:

    1. Ping de CloudAgent-service om te controleren of deze bereikbaar is.
    2. Zorg ervoor dat alle knooppunten de DNS van de CloudAgent kunnen oplossen door de volgende opdracht uit te voeren op elk knooppunt:
      Resolve-DnsName <FQDN of cloudagent>
      
    3. Wanneer de vorige stap is geslaagd op de knooppunten, moet u ervoor zorgen dat de knooppunten de CloudAgent-poort kunnen bereiken om te controleren of een proxy deze verbinding niet probeert te blokkeren en de poort is geopend. Voer hiervoor de volgende opdracht uit op elk knooppunt:
      Test-NetConnection <FQDN of cloudagent> -Port <Cloudagent port - default 65000>
      
    4. Als u wilt controleren of de clusterservice wordt uitgevoerd voor een failovercluster, kunt u ook de volgende opdracht uitvoeren:
      Get-ClusterGroup -Name (Get-AksHciConfig).Moc['clusterRoleName']
      

Fout: 'Install-Moc is mislukt. Uitzondering [Dit geeft meestal aan dat er een probleem is opgetreden tijdens het registreren van de resourcenaam als computerobject met de domeincontroller en/of de DNS-server. Controleer of het clustercomputerobject machtigingen heeft om computerobject te maken in de domeincontroller. Controleer de domeincontroller en DNS-logboeken op gerelateerde foutberichten.'

Dit geeft meestal aan dat het clusternaamobject (CNO) dat uw onderliggende failovercluster vertegenwoordigt in Active Directory-domein Services (AD DS) geen machtigingen heeft om een virtueel computerobject (VCO) te maken in de organisatie-eenheid (OE) of in de container waarin het cluster zich bevindt.

Als u geen domeinbeheerder bent, kunt u er een vragen om de CNO-machtigingen te verlenen aan de organisatie-eenheid of een VCO voor de algemene clusterservice van de cloudagent te voorbereiden.

Als u een domeinbeheerder bent, is het nog steeds mogelijk dat uw organisatie-eenheid of container niet over de vereiste machtigingen beschikt. De afdwingingsmodus, geïntroduceerd in KB5008383, kan bijvoorbeeld zijn ingeschakeld in Active Directory. Probeer het volgende voordat u een nieuwe installatie probeert uit te voeren.

  1. Navigeer naar Active Directory.
  2. Klik met de rechtermuisknop op de organisatie-eenheid of container waarin het cluster zich bevindt.
  3. Selecteer Besturingselement delegeren... om de wizard Delegering van het besturingselement te openen.
  4. Klik op Volgende> klik op Toevoegen... om het venster Gebruikers, computers of groepen selecteren te openen.
  5. Selecteer de gewenste groep of gebruikers aan wie u het besturingselement > wilt delegeren, klik op OK.
  6. Selecteer Een aangepaste taak maken om Klik op Volgende te delegeren> om door te gaan naar de pagina Active Directory-objecttype.
  7. Selecteer alleen de volgende objecten in de map> Computerobjecten> Selecteren Geselecteerde objecten in deze map maken en Geselecteerde objecten in deze map> verwijderen Klik op Volgende om door te gaan naar de pagina Machtigingen.
  8. Selecteer Alle onderliggende objecten maken en Alle onderliggende objecten verwijderen uit de lijst met machtigingen > Klik op Volgende>voltooien

Als het opnieuw installeren mislukt, voert u het bovenstaande opnieuw uit met de volgende wijzigingen in stap 7 en 8:

  • Stap 7: Selecteer deze map, bestaande objecten in deze map en maak nieuwe objecten in deze map> klik op Volgende.
  • Stap 8: Selecteer Lezen, Schrijven, Alle onderliggende objecten maken en Alle onderliggende objecten verwijderen uit de lijst met machtigingen > Klik op Volgende> klik op Voltooien.

Fout: Install-AksHci mislukt met Install-Moc is mislukt. Logboeken zijn beschikbaar C:\Users\xxx\AppData\Local\Temp\v0eoltcc.a10'

Deze fout kan optreden bij het uitvoeren van Install-AksHci.

U kunt meer informatie krijgen door uit te voeren $error = Install-AksHci en vervolgens $error[0].Exception.InnerException.

PowerShell-implementatie controleert niet op beschikbaar geheugen voordat u een nieuw workloadcluster maakt

De Aks-Hci PowerShell-opdrachten valideren het beschikbare geheugen op de hostserver niet voordat u Kubernetes-knooppunten maakt. Dit probleem kan leiden tot geheugenuitputting en virtuele machines die niet worden gestart. Deze fout wordt momenteel niet correct verwerkt en de implementatie reageert niet meer zonder duidelijk foutbericht.

Als u een implementatie hebt die niet meer reageert, opent u Logboeken en controleert u op een hyper-V-gerelateerd foutbericht dat aangeeft dat er onvoldoende geheugen is om de VIRTUELE machine te starten.

De fout 'Kan token niet verkrijgen' wordt weergegeven bij het uitvoeren van Set-AksHciRegistration

Deze fout kan optreden wanneer u meerdere tenants in uw Azure-account hebt.

Gebruik $tenantId = (Get-AzContext).Tenant.Id dit om de juiste tenant in te stellen. Neem vervolgens deze tenant op als parameter tijdens het uitvoeren van Set-AksHciRegistration.

Fout: 'Wachten op pod 'CloudOperator' is gereed'

Bij het implementeren van een AKS-cluster op een Azure-VM is de installatie vastgelopen Waiting for pod 'Cloud Operator' to be ready...en is de installatie na twee uur mislukt en is er een time-out opgetreden. Pogingen om problemen op te lossen door te controleren of de gateway en DE DNS-server correct werkten. Controleert of er geen IP- of MAC-adresconflicten zijn gevonden. In de logboeken is de VIP-groep niet weergegeven. Er is een beperking opgetreden bij het ophalen van de containerinstallatiekopie met behulp van sudo docker pull ecpacr.azurecr.io/kube-vip:0.3.4 een time-out voor Transport Layer Security (TLS) in plaats van niet-geautoriseerd.

Ga als volgt te werk om dit probleem op te lossen:

  1. Begin met het implementeren van uw cluster.
  2. Wanneer het cluster is geïmplementeerd, maakt u verbinding met uw beheercluster-VM via SSH, zoals hieronder wordt weergegeven:
ssh -i (Get-MocConfig)['sshPrivateKey'] clouduser@<IP Address>
  1. Wijzig de MTU-instelling (maximumtransmissieeenheid). Aarzel niet om de wijziging aan te brengen; als u de wijziging te laat aanbrengt, mislukt de implementatie. Als u de MTU-instelling wijzigt, wordt de pull van de containerinstallatiekopie opgeheven.
sudo ifconfig eth0 mtu 1300
  1. Voer de volgende opdracht uit om de status van uw containers weer te geven:
sudo docker ps -a

Nadat u deze stappen hebt uitgevoerd, moet de pull-containerinstallatiekopie worden gedeblokkeerd.

Fout: 'Install-Moc is mislukt met fout - Uitzondering [Kan de algemene rol van het failovercluster niet maken.]'

Deze fout geeft aan dat het IP-adres van de cloudservice geen deel uitmaakt van het clusternetwerk en niet overeenkomt met een van de clusternetwerken waarvoor de client and cluster communication rol is ingeschakeld.

Voer Get-ClusterNetwork uit om dit probleem op te lossen, waarbij Role gelijk is ClusterAndClientaan . Selecteer vervolgens op een van de clusterknooppunten de naam, het adres en het adresmasker om te controleren of het IP-adres dat is opgegeven voor de -cloudServiceIP parameter New-AksHciNetworkSetting overeenkomt met een van de weergegeven netwerken.

De cmdlet Enable-AksHciArcConnection genereert een waarschuwing die aangeeft dat GetServicePrincipals onvoldoende bevoegdheden heeft om aangepaste locaties in te schakelen

Enable-AksHciArcConnection kan een AKS-cluster verbinden met Azure, maar de volgende waarschuwing wordt weergegeven wanneer de klant een service-principal gebruikt voor verificatie:

WARNING: Error occurred while executing GetServicePrincipals
Code: Authorization_RequestDenied
Message: Insufficient privileges to complete the operation.
RequestId: <removed>
DateTimeStamp: <removed>
HttpStatusCode: Forbidden
HttpStatusDescription: Forbidden
HttpResponseStatus: Completed
WARNING: Custom locations has not been enabled on the AKS-HCI cluster. To enable custom locations manually, visit aka.ms/enable-custom-location

Het huidige gedrag van Arc-onboarding is om standaard aangepaste locaties in te schakelen. Als u aangepaste locaties wilt inschakelen, wordt de actie GetServicePrincipals uitgevoerd in de context van de aangemelde Azure-gebruiker. Als de gebruiker (of SPN) niet over voldoende machtigingen beschikt om dit te kunnen doen, geeft de opdracht een waarschuwing uit dat deze machtigingen niet bestaan en daarom wordt de functie Aangepaste locaties niet ingeschakeld.

Als u niet wilt dat aangepaste locaties worden ingeschakeld, kunt u deze waarschuwing veilig negeren, omdat dit geen invloed heeft op de onboarding van clusters naar Arc. Als u echter aangepaste locaties moet inschakelen, moet u de benodigde machtigingen verlenen aan de gebruiker (of SPN).

Volgende stappen

Als u problemen blijft ondervinden wanneer u AKS Arc gebruikt, kunt u fouten indienen via GitHub.