Bewerken

Share via


Problemen en fouten tijdens een AKS Arc-installatie oplossen

Van toepassing op: AKS in Azure Stack HCI, AKS op Windows Server In dit artikel worden bekende problemen en fouten beschreven die kunnen optreden bij het installeren van AKS Arc. U kunt ook bekende problemen met bij het upgraden van AKS Arc en bij het gebruik van Windows Admin Center bekijken.

Fout 'Kan niet wachten op invoegtoepassing arc-onboarding'

Dit foutbericht wordt weergegeven na het uitvoeren van Install-AksHci.

Notitie

De fout kan worden veroorzaakt doordat Private Link ingeschakeld tijdens de installatie. Er is momenteel geen tijdelijke oplossing voor dit scenario. AKS op HCI werkt niet met Private Link.

Als u Private Link niet gebruikt, gebruikt u de volgende stappen om dit probleem op te lossen:

  1. Open PowerShell en voer Uninstall-AksHci uit.
  2. Open de Azure Portal en navigeer naar de resourcegroep die u hebt gebruikt bij het uitvoeren van Install-AksHci.
  3. Controleer op verbonden clusterresources die worden weergegeven in de status Verbroken en bevatten een naam die wordt weergegeven als een willekeurig gegenereerde GUID.
  4. Verwijder deze clusterresources.
  5. Sluit de PowerShell-sessie en open een nieuwe sessie voordat u het opnieuw uitvoert Install-AksHci .

Fout: 'Install-AksHci is mislukt, service heeft een fout geretourneerd. Status=403 Code="RequestDisallowedByPolicy"' fout bij het installeren van AKS-HCI

Deze fout kan worden veroorzaakt door het installatieproces dat probeert een Azure-beleid te schenden dat is ingesteld op het Azure-abonnement of de resourcegroep die is opgegeven tijdens het onboardingproces voor Azure Arc. Deze fout kan optreden voor gebruikers die Azure-beleid hebben gedefinieerd op abonnements- of resourcegroepniveau en vervolgens proberen AKS te installeren op Azure Stack HCI, wat in strijd is met een Azure Policy.

Om dit probleem op te lossen, leest u het foutbericht om te begrijpen welke Azure Policy is geschonden door uw Azure-beheerder en wijzigt u vervolgens het Azure-beleid door een uitzondering te maken op het Azure-beleid. Zie Azure Policy uitzonderingsstructuur voor meer informatie over beleidsonderzondering.

Fout: Install-AksHci mislukt met fout - [Het object bestaat al] Er is een fout opgetreden tijdens het maken van de resource 'IPv4-adres xxx.xx.xx.xx' voor de geclusterde rol 'xx-xxxxxxxx-xxxx-xxxx-xxxxxxxxx'

Een eerder geïnstalleerde functie heeft de status Mislukt en is niet verwijderd. Mogelijk ziet u de volgende fout:

Exception [An error occurred while creating resource 'MOC Cloud Agent Service' for the clustered role 'ca-3f72bdeb-xxxx-4ae9-a721-3aa902a998f0'.]
Stacktrace [at Add-FailoverClusterGenericRole, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Common.psm1: line 2987
at Install-CloudAgent, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1310
at Install-MocAgents, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1229
at Initialize-Cloud, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1135
at Install-MocInternal, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1078
at Install-Moc, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 207
at Install-AksHciInternal, C:\Program Files\WindowsPowerShell\Modules\AksHci\1.1.25\AksHci.psm1: line 3867
at Install-AksHci, C:\Program Files\WindowsPowerShell\Modules\AksHci\1.1.25\AksHci.psm1: line 778
at <ScriptBlock>, <No file>: line 1]
InnerException[The object already exists]

Of u ziet het volgende:

Install-Moc failed.
Exception [Unable to save property changes for 'IPv4 Address xxx.168.18.0'.]
Stacktrace [at Add-FailoverClusterGenericRole, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Common.psm1: line 2971
at Install-CloudAgent, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1310
at Install-MocAgents, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1229
at Initialize-Cloud, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1135
at Install-MocInternal, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1078
at Install-Moc, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 207
at Install-AksHciInternal, C:\Program Files\WindowsPowerShell\Modules\AksHci\1.1.25\AksHci.psm1: line 3867
at Install-AksHci, C:\Program Files\WindowsPowerShell\Modules\AksHci\1.1.25\AksHci.psm1: line 778
at <ScriptBlock>, <No file>: line 1]
InnerException[A matching cluster network for the specified IP address could not be found]

U kunt dit probleem oplossen door de clusterrol handmatig op te schonen. U kunt de resource verwijderen uit failoverclusterbeheer door de volgende PowerShell-cmdlet uit te voeren: Remove-ClusterResource -name <resource name>.

Fout: 'GetRelease-fout geretourneerd door API-aanroep: fout bij het downloaden van bestand: hash komt niet overeen'

De Install-AksHci cmdlet mislukt met 'GetRelease-fout geretourneerd door API-aanroep: bestandsdownloadfout: hash komt niet overeen'.

  1. Open PowerShell en voer uit Uninstall-AksHci.
  2. Voer een installatie opnieuw uit.
  3. Als het probleem zich blijft voordoen, gebruikt u de -concurrentDownloads parameter met Set-AksHciConfig en stelt u deze in op een getal dat lager is dan de standaardwaarde 10 voordat u een installatie opnieuw probeert uit te voeren. Als u het aantal gelijktijdige downloads vermindert, kunnen gevoelige netwerken grote bestandsdownloads mogelijk voltooien. Deze parameter is een preview-functie.

Na het implementeren van AKS in Azure Stack HCI 21H2, werd bij het opnieuw opstarten van de knooppunten de status Mislukt voor facturering weergegeven

Na de implementatie, bij het opnieuw opstarten van de Azure Stack HCI-knooppunten, werd in het AKS-rapport de status Mislukt weergegeven voor facturering.

U kunt dit probleem oplossen door de instructies te volgen om het token handmatig te draaien en de KMS-invoegtoepassing opnieuw op te starten.

er is een time-out opgetreden voor Install-AksHci met de fout ''

Na het uitvoeren van Install-AksHci is de installatie gestopt en wordt het volgende foutbericht weergegeven:

\kubectl.exe --kubeconfig=C:\AksHci\0.9.7.3\kubeconfig-clustergroup-management 
get akshciclusters -o json returned a non zero exit code 1 
[Unable to connect to the server: dial tcp 192.168.0.150:6443: 
connectex: A connection attempt failed because the connected party 
did not properly respond after a period of time, or established connection 
failed because connected host has failed to respond.]

Er zijn meerdere redenen waarom een installatie kan mislukken met de waiting for API server fout.

In de volgende sectie worden mogelijke oorzaken en oplossingen voor deze fout beschreven.

Reden 1: Onjuiste IP-gatewayconfiguratie Als u statische IP-adressen gebruikt en u het volgende foutbericht hebt ontvangen, controleert u of de configuratie voor het IP-adres en de gateway juist is.

Install-AksHci 
C:\AksHci\kvactl.exe create --configfile C:\AksHci\yaml\appliance.yaml  --outfile C:\AksHci\kubeconfig-clustergroup-management returned a non-zero exit code 1 [ ]

Voer de volgende opdracht uit om te controleren of u de juiste configuratie hebt voor uw IP-adres en gateway:

ipconfig /all

Bevestig de configuratie in de weergegeven configuratie-instellingen. U kunt ook proberen de IP-gateway en DNS-server te pingen.

ping <DNS server>

Als deze methoden niet werken, gebruikt u New-AksHciNetworkSetting om de configuratie te wijzigen.

Reden 2: Onjuiste DNS-server Als u statische IP-adressen gebruikt, controleert u of de DNS-server correct is geconfigureerd. Gebruik de volgende opdracht om het DNS-serveradres van de host te controleren:

Get-NetIPConfiguration.DNSServer | ?{ $_.AddressFamily -ne 23} ).ServerAddresses

Controleer of het ADRES van de DNS-server hetzelfde is als het adres dat wordt gebruikt bij het uitvoeren New-AksHciNetworkSetting van de volgende opdracht:

Get-MocConfig

Als de DNS-server onjuist is geconfigureerd, installeert u AKS opnieuw op Azure Stack HCI met de juiste DNS-server. Zie Opnieuw opstarten, verwijderen of opnieuw installeren van Azure Kubernetes Service op Azure Stack HCI voor meer informatie.

Het probleem is opgelost na het verwijderen van de configuratie en het opnieuw opstarten van de VM met een nieuwe configuratie.

Fout: het proces kan het bestand 'mocstack.cab' niet openen omdat het door een ander proces wordt gebruikt"

Install-AksHci is mislukt met deze fout omdat een ander proces toegang heeft tot mocstack.cab.

U kunt dit probleem oplossen door alle geopende PowerShell-vensters te sluiten en vervolgens een nieuw PowerShell-venster te openen.

Fout: Install-AksHci mislukt met 'Install-MOC failed with the error - the process cannot access the file \<path> because it is used by another process.'

Het bestand kan niet worden gebruikt omdat het door een ander proces wordt gebruikt.

U kunt dit probleem oplossen door de PowerShell-sessie opnieuw te starten. Sluit het PowerShell-venster en probeer Install-AksHci opnieuw.

Fout: een bestaande verbinding is geforceerd gesloten door de externe host"

Install-AksHci is mislukt met deze fout omdat de IP-poolbereiken die zijn opgegeven in de AKS op Azure Stack HCI-configuratie met 1 zijn uitgeschakeld in de CIDR, waardoor CloudAgent kan vastlopen. Als u bijvoorbeeld subnet 10.0.0.0/21 hebt met een adresbereik van 10.0.0.0 - 10.0.7.255 en u vervolgens een beginadres van 10.0.0.1 of een eindadres van 10.0.7.254 gebruikt, loopt CloudAgent vast.

U kunt dit probleem omzeilen door New-AksHciNetworkSetting uit te voeren en een ander geldig IP-adresbereik te gebruiken voor uw VIP-groep en Kubernetes-knooppuntgroep. Zorg ervoor dat de waarden die u gebruikt, niet met 1 zijn uitgeschakeld aan het begin of einde van het adresbereik.

Install-AksHci mislukt bij een installatie met meerdere knooppunten met de fout 'Knooppunten hebben de actieve status niet bereikt'

Bij het uitvoeren van Install-AksHci op een installatie met één knooppunt, werkte de installatie, maar bij het instellen van het failovercluster mislukt de installatie met het foutbericht. Het pingen van de cloudagent liet echter zien dat de CloudAgent bereikbaar was.

Voer de volgende opdracht uit op elk knooppunt om ervoor te zorgen dat alle knooppunten de DNS van de CloudAgent kunnen oplossen:

Resolve-DnsName <FQDN of cloudagent>

Wanneer de bovenstaande stap is voltooid op de knooppunten, moet u ervoor zorgen dat de knooppunten de CloudAgent-poort kunnen bereiken om te controleren of een proxy deze verbinding niet probeert te blokkeren en of de poort is geopend. Voer hiervoor de volgende opdracht uit op elk knooppunt:

Test-NetConnection  <FQDN of cloudagent> -Port <Cloudagent port - default 65000>

Het AKS in Azure Stack HCI-downloadpakket mislukt met de fout: 'msft.sme.aks kan niet worden geladen'

De fout is het gevolg van een fout bij het downloaden.

Als u deze fout krijgt, moet u de nieuwste versie van Microsoft Edge of Google Chrome gebruiken en het opnieuw proberen.

Bij het uitvoeren van Set-AksHciRegistration wordt de fout 'Kan geregistreerde resourceproviders niet controleren' weergegeven

Deze fout treedt op na het uitvoeren van Set-AksHciRegistration in een AKS op Azure Stack HCI-installatie. De fout geeft aan dat de Kubernetes-resourceproviders niet zijn geregistreerd voor de tenant die momenteel is aangemeld.

Voer de Azure CLI of de onderstaande PowerShell-stappen uit om dit probleem op te lossen:

az provider register --namespace Microsoft.Kubernetes
az provider register --namespace Microsoft.KubernetesConfiguration
Register-AzResourceProvider -ProviderNamespace Microsoft.Kubernetes
Register-AzResourceProvider -ProviderNamespace Microsoft.KubernetesConfiguration

De registratie duurt ongeveer 10 minuten. Gebruik de volgende opdrachten om het registratieproces te bewaken.

az provider show -n Microsoft.Kubernetes -o table
az provider show -n Microsoft.KubernetesConfiguration -o table
Get-AzResourceProvider -ProviderNamespace Microsoft.Kubernetes
Get-AzResourceProvider -ProviderNamespace Microsoft.KubernetesConfiguration

Install-AksHci blijft hangen in de fase Wachten tot azure-arc-onboarding is voltooid voordat er een time-out optreedt

Notitie

Dit probleem is opgelost in de release van mei 2022 en hoger.

Install-AksHci loopt vast voordat Waiting for azure-arc-onboarding to complete er een time-out optreedt wanneer:

  • Een service-principal wordt gebruikt in AKS in Azure Stack HCI Registration (Set-AksHciRegistration).
  • Az.Accounts PowerShell-modules versie (2.7.x) geïnstalleerd.

Az.Accounts 2.7.x versies verwijdert de ServicePrincipalSecret en CertificatePassword in PSAzureRmAccount, die wordt gebruikt door AKS op Azure Stack HCI voor azure Arc-onboarding.

Ga als volgende te werk om te reproduceren:

  1. Installeer Az.Accounts de versie van PowerShell-modules (>= 2.7.0).
  2. Set-AksHciRegistration met behulp van een service-principal.
  3. Install-AksHci.

Verwacht gedrag:

  1. De installatie van AKS in Azure Stack HCI loopt vast op Waiting for azure-arc-onboarding to complete.
  2. Azure-arc-onboarding pods komen in de crashlus terecht.
  3. De Azure-arc-onboarding pods-fout met de volgende fout:
    Starting onboarding process ERROR: variable CLIENT_SECRET is required

Ga als volgt te werk om het probleem op te lossen:

Verwijder Az.Accounts-modules met versie 2.7.x. Voer de volgende cmdlet uit:

Uninstall-Module -Name Az.Accounts -RequiredVersion 2.7.0 -Force

Tijdens de installatie wordt deze fout weergegeven: 'Kan geen apparaat-VM maken: kan geen virtuele machine maken: rpc-fout = onbekend desc = Er is een uitzondering opgetreden. (Algemene fout)]'

Deze fout treedt op als Azure Stack HCI geen beleid heeft. De verbindingsstatus op het cluster kan aangeven dat het is verbonden, maar in het gebeurtenislogboek wordt het waarschuwingsbericht weergegeven dat Azure Stack HCI's subscription is expired, run Sync-AzureStackHCI to renew the subscription.

U kunt deze fout oplossen door te controleren of het cluster is geregistreerd bij Azure met behulp van de Get-AzureStackHCI PowerShell-cmdlet die beschikbaar is op uw computer. Het Windows Admin Center-dashboard toont ook statusinformatie over de Azure-registratie van het cluster.

Als het cluster al is geregistreerd, moet u het veld LastConnected weergeven in de uitvoer van Get-AzureStackHCI. Als het veld laat zien dat het langer dan 30 dagen geleden is, moet u proberen de situatie op te lossen met behulp van de cmdlet Sync-AzureStackHCI.

U kunt ook controleren of elk knooppunt van uw cluster de vereiste licentie heeft met behulp van de volgende cmdlet:

Get-ClusterNode | % { Get-AzureStackHCISubscriptionStatus -ComputerName $_ }
Computer Name Subscription Name           Status   Valid To
------------- -----------------           ------   --------
MS-HCIv2-01   Azure Stack HCI             Active   12/23/2021 12:00:14 AM
MS-HCIv2-01   Windows Server Subscription Inactive

MS-HCIv2-02   Azure Stack HCI             Active   12/23/2021 12:00:14 AM
MS-HCIv2-02   Windows Server Subscription Inactive

MS-HCIv2-03   Azure Stack HCI             Active   12/23/2021 12:00:14 AM
MS-HCIv2-03   Windows Server Subscription Inactive

Als het probleem niet is opgelost nadat u de Sync-AzureStackHCI cmdlet hebt uitgevoerd, neemt u contact op met Microsoft Ondersteuning.

Na een mislukte installatie werkt het uitvoeren van Install-AksHci niet

Dit probleem treedt op omdat een mislukte installatie kan leiden tot gelekte resources die moeten worden opgeschoond voordat u de installatie opnieuw kunt uitvoeren.

Als de installatie mislukt met Install-AksHci, moet u Uninstall-AksHci uitvoeren voordat u het opnieuw uitvoert Install-AksHci .

Fout: 'Kan virtueel netwerk niet afstemmen' of 'Fout: Install-Moc mislukt met fout - Uitzondering [[Moc] Deze machine lijkt niet te zijn geconfigureerd voor implementatie]'

U kunt deze fouten activeren wanneer u uitvoert Install-AksHci zonder eerst Set-AksHciConfig uit te voeren.

U kunt de fout oplossen door alle PowerShell-vensters uit te voeren uninstall-akshci en te sluiten. Open een nieuwe PowerShell-sessie en start het AKS-HCI-installatieproces opnieuw door AKS-HCI te installeren met behulp van PowerShell.

Set-AksHciConfig mislukt met de fout 'GetCatalog-fout geretourneerd door API-aanroep: ... proxyconnect tcp: tls: first record does not look like a TLS Handshake"

De Set-AksHciConfig PowerShell-cmdlet mislukt met de volgende fout:

GetCatalog error returned by API call: ... proxyconnect tcp: tls: first record does not look like a TLS Handshake

Als u AKS gebruikt met een proxyserver, hebt u mogelijk de verkeerde URL gebruikt bij het instellen van de vereiste URL-waarde voor de HTTPS-proxy. De waarden van de HTTP-proxy-URL en de HTTPS-proxy-URL zijn beide vereist bij het configureren van AKS met een proxyserver, maar het is gebruikelijk dat beide waarden dezelfde URL met http-voorvoegsel delen.

Als dit mogelijk het geval is in uw omgeving, probeert u de volgende stappen voor risicobeperking:

  1. Sluit het PowerShell-venster en open een nieuw venster.
  2. Voer de New-AksHciNetworkSetting cmdlets en New-AksHciProxySetting opnieuw uit. Wanneer u uitvoert New-AksHciProxySetting, stelt u de -https parameter in met dezelfde URL-waarde met http-voorvoegsel die u hebt ingesteld voor -http.
  3. Voer uit Set-AksHciConfig en ga verder.

Wanneer u AKS implementeert in Azure Stack HCI met een onjuist geconfigureerd netwerk, treedt er op verschillende punten een time-out op voor de implementatie

Wanneer u AKS implementeert in Azure Stack HCI, kan er een time-out optreden voor de implementatie op verschillende punten van het proces, afhankelijk van waar de onjuiste configuratie is opgetreden. U moet het foutbericht bekijken om de oorzaak te bepalen en waar deze is opgetreden.

In de volgende fout is het punt waarop de onjuiste configuratie is opgetreden bijvoorbeeld in Get-DownloadSdkRelease -Name "mocstack-stable":

$vnet = New-AksHciNetworkSettingSet-AksHciConfig -vnet $vnetInstall-AksHciVERBOSE: 
Initializing environmentVERBOSE: [AksHci] Importing ConfigurationVERBOSE: 
[AksHci] Importing Configuration Completedpowershell : 
GetRelease - error returned by API call: 
Post "https://msk8s.api.cdp.microsoft.com/api/v1.1/contents/default/namespaces/default/names/mocstack-stable/versions/0.9.7.0/files?action=generateDownloadInfo&ForegroundPriority=True": 
dial tcp 52.184.220.11:443: connectex: 
A connection attempt failed because the connected party did not properly
respond after a period of time, or established connection failed because
connected host has failed to respond.At line:1 char:1+ powershell -command
{ Get-DownloadSdkRelease -Name "mocstack-stable"}

Dit geeft aan dat het fysieke Azure Stack HCI-knooppunt de naam van de download-URL kan omzetten, msk8s.api.cdp.microsoft.commaar dat het knooppunt geen verbinding kan maken met de doelserver.

Om dit probleem op te lossen, moet u bepalen waar de uitsplitsing is opgetreden in de verbindingsstroom. Hier volgen enkele stappen om het probleem op te lossen vanaf het fysieke clusterknooppunt:

  1. Ping de DNS-doelnaam: ping msk8s.api.cdp.microsoft.com.
  2. Als u een reactie krijgt en er geen time-out is, werkt het basisnetwerkpad.
  3. Als er een time-out optreedt voor de verbinding, kan er een onderbreking zijn in het gegevenspad. Zie Proxy-instellingen controleren voor meer informatie. Of er kan een onderbreking zijn in het retourpad, dus controleer de firewallregels.

Set-AksHciConfig mislukt met WinRM-fouten, maar geeft aan dat WinRM correct is geconfigureerd

Wanneer u Set-AksHciConfig uitvoert, kan de volgende fout optreden:

WinRM service is already running on this machine.
WinRM is already set up for remote management on this computer.
Powershell remoting to TK5-3WP08R0733 was not successful.
At C:\Program Files\WindowsPowerShell\Modules\Moc\0.2.23\Moc.psm1:2957 char:17
+ ...             throw "Powershell remoting to "+$env:computername+" was n ...
+                 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    + CategoryInfo          : OperationStopped: (Powershell remo...not successful.:String) [], RuntimeException
    + FullyQualifiedErrorId : Powershell remoting to TK5-3WP08R0733 was not successful.

Deze fout treedt meestal op als gevolg van een wijziging in het beveiligingstoken van de gebruiker (als gevolg van een wijziging in het groepslidmaatschap), een wachtwoordwijziging of een verlopen wachtwoord. In de meeste gevallen kan het probleem worden opgelost door u af te melden bij de computer en u opnieuw aan te melden. Als het nog steeds mislukt, kunt u een probleem melden bij GitHub AKS HCI-problemen.

Rotatie van moc-agentlogboek mislukt

Van Moc-agents wordt verwacht dat ze alleen de laatste 100 agentlogboeken bewaren. Ze moeten de oudere logboeken verwijderen. De logboekrotatie vindt echter niet plaats en logboeken krijgen steeds meer schijfruimte in beslag.

Om te reproduceren: Install AksHci en een cluster actief hebben totdat het aantal agentlogboeken groter is dan 100. Op het moment dat het nde logboek wordt gemaakt, wordt verwacht dat de agents het n-100e logboek verwijderen, als ze bestaan.

Het probleem oplossen:

  1. Wijzig de logconf-bestanden van de cloudagent en de knooppuntagenten. Logconfig van cloudagent bevindt zich op:
    (Get-MocConfig).cloudConfigLocation+"\log\logconf".
    Logconfig van knooppuntagent bevindt zich op:
    (Get-MocConfig).cloudConfigLocation+"\log\logconf".

  2. Wijzig de waarde van Limiet in 100 en Sleuven in 100 en sla de configuratiebestanden op.

  3. Start de cloudagent en knooppuntagenten opnieuw om deze wijzigingen te registreren.

Met deze stappen wordt de logboekrotatie pas gestart nadat er 100 nieuwe logboeken zijn gegenereerd op basis van het opnieuw opstarten van de agent. Als er al n agentlogboeken zijn op het moment van opnieuw opstarten, wordt de logboekrotatie pas gestart nadat n+100-logboeken zijn gegenereerd.

De cloudagent kan mogelijk niet worden gestart wanneer padnamen met spaties erin worden gebruikt

Wanneer u Set-AksHciConfig gebruikt om parameters , -workingDir, -cloudConfigLocationof -nodeConfigLocation op te geven -imageDirmet een padnaam die een spatieteken bevat, zoals D:\Cloud Share\AKS HCI, kan de clusterservice van de cloudagent niet beginnen met het volgende (of een soortgelijk) foutbericht:

Failed to start the cloud agent generic cluster service in failover cluster. The cluster resource group os in the 'failed' state. Resources in 'failed' or 'pending' states: 'MOC Cloud Agent Service'

U kunt dit probleem omzeilen door een pad te gebruiken dat geen spaties bevat, bijvoorbeeld C:\CloudShare\AKS-HCI.

Fout: 'Install-Moc is mislukt met fout - Uitzondering [CloudAgent is onbereikbaar. MOC CloudAgent kan om de volgende redenen onbereikbaar zijn]'

Deze fout kan optreden wanneer de infrastructuur onjuist is geconfigureerd.

Voer de volgende stappen uit om deze fout op te lossen:

  1. Controleer de configuratie en gatewayinstellingen van de host-DNS-server:

    1. Controleer of de DNS-server juist is geconfigureerd. Voer de volgende opdracht uit om het DNS-serveradres van de host te controleren:
      ((Get-NetIPConfiguration).DNSServer | ?{ $_.AddressFamily -ne 23}).ServerAddresses
      
    2. Voer de opdracht ipconfig/alluit om te controleren of uw IP-adres en gatewayconfiguratie juist zijn.
    3. Probeer de IP-gateway en de DNS-server te pingen.
  2. Controleer de CloudAgent-service om te controleren of deze wordt uitgevoerd:

    1. Ping de CloudAgent-service om te controleren of deze bereikbaar is.
    2. Zorg ervoor dat alle knooppunten de DNS van de CloudAgent kunnen oplossen door de volgende opdracht uit te voeren op elk knooppunt:
      Resolve-DnsName <FQDN of cloudagent>
      
    3. Wanneer de vorige stap is geslaagd op de knooppunten, moet u ervoor zorgen dat de knooppunten de CloudAgent-poort kunnen bereiken om te controleren of een proxy deze verbinding niet probeert te blokkeren en de poort is geopend. Voer hiervoor de volgende opdracht uit op elk knooppunt:
      Test-NetConnection <FQDN of cloudagent> -Port <Cloudagent port - default 65000>
      
    4. Als u wilt controleren of de clusterservice wordt uitgevoerd voor een failovercluster, kunt u ook de volgende opdracht uitvoeren:
      Get-ClusterGroup -Name (Get-AksHciConfig).Moc['clusterRoleName']
      

Fout: 'Install-Moc is mislukt. Uitzondering [Dit geeft meestal aan dat er een probleem is opgetreden tijdens het registreren van de resourcenaam als een computerobject bij de domeincontroller en/of de DNS-server. Controleer of het clustercomputerobject machtigingen heeft om computerobject in de domeincontroller te maken. Controleer de domeincontroller en DNS-logboeken op gerelateerde foutberichten.'

Dit geeft meestal aan dat het clusternaamobject (CNO) dat uw onderliggende failovercluster in Active Directory Domain Services (AD DS) vertegenwoordigt, geen machtigingen heeft om een VCO (Virtual Computer Object) te maken in de organisatie-eenheid (OE) of in de container waarin het cluster zich bevindt.

Als u geen domeinbeheerder bent, kunt u er een vragen om de CNO-machtigingen te verlenen aan de OE of een VCO voor te stellen voor de algemene clusterservice van de cloudagent.

Als u een domeinbeheerder bent, is het nog steeds mogelijk dat uw organisatie-eenheid of container niet over de vereiste machtigingen beschikt. De afdwingingsmodus, geïntroduceerd in KB5008383, kan bijvoorbeeld zijn ingeschakeld in Active Directory. Probeer het volgende voordat u het opnieuw installeert.

  1. Navigeer naar Active Directory: gebruikers en computers.
  2. Klik met de rechtermuisknop op de organisatie-eenheid of container waarin het cluster zich bevindt.
  3. Selecteer Beheer delegeren... om de wizard Delegering van besturingselementen te openen.
  4. Klik op Volgende> Klik op Toevoegen... om het venster Gebruikers, Computers of Groepen selecteren te openen.
  5. Selecteer de gewenste groep of gebruikers aan wie u het beheer > wilt delegeren klik op OK.
  6. Selecteer Een aangepaste taak maken om te delegeren> Klik op Volgende om naar de pagina Active Directory-objecttype te gaan.
  7. Selecteer Alleen de volgende objecten in de map>Selecteer Computerobjecten> Selecteer Geselecteerde objecten in deze map maken en Geselecteerde objecten in deze map> verwijderen Klik op Volgende om naar de pagina Machtigingen te gaan.
  8. Selecteer Alle onderliggende objecten maken en Alle onderliggende objecten verwijderen in de lijst met machtigingen > Klik op Volgende>voltooien

Als het opnieuw installeren mislukt, probeert u het bovenstaande opnieuw met de volgende wijzigingen in stap 7 en 8:

  • Stap 7: Selecteer Deze map, bestaande objecten in deze map en maak nieuwe objecten in deze map> klik op Volgende.
  • Stap 8: Selecteer Lezen, Schrijven, Alle onderliggende objecten maken en Alle onderliggende objecten verwijderen uit de lijst met machtigingen > Klik op Volgende> klik op Voltooien.

Fout: Install-AksHci mislukt met 'Install-Moc failed. Logboeken zijn beschikbaar C:\Users\xxx\AppData\Local\Temp\v0eoltcc.a10'

Deze fout kan optreden bij het uitvoeren van Install-AksHci.

U kunt meer informatie krijgen door en vervolgens $error[0].Exception.InnerExceptionuit te voeren$error = Install-AksHci.

PowerShell-implementatie controleert niet op beschikbaar geheugen voordat een nieuw workloadcluster wordt gemaakt

De Aks-Hci PowerShell-opdrachten valideren het beschikbare geheugen op de hostserver niet voordat Kubernetes-knooppunten worden gemaakt. Dit probleem kan leiden tot geheugenuitputting en virtuele machines die niet worden gestart. Deze fout wordt momenteel niet correct verwerkt en de implementatie reageert niet meer zonder duidelijk foutbericht.

Als u een implementatie hebt die niet meer reageert, opent u Logboeken en controleert u op een hyper-V-gerelateerd foutbericht dat aangeeft dat er onvoldoende geheugen is om de VM te starten.

De fout 'Kan token niet verkrijgen' wordt weergegeven bij het uitvoeren van Set-AksHciRegistration

Deze fout kan optreden wanneer u meerdere tenants in uw Azure-account hebt.

Gebruik $tenantId = (Get-AzContext).Tenant.Id om de juiste tenant in te stellen. Neem vervolgens deze tenant op als parameter tijdens het uitvoeren van Set-AksHciRegistration.

Fout: 'Wachten tot pod 'Cloud Operator' gereed is'

Wanneer u probeert een AKS-cluster te implementeren op een Azure-VM, is de installatie vastgelopen op Waiting for pod 'Cloud Operator' to be ready..., waarna de installatie is mislukt en er na twee uur een time-out optreedt. Pogingen om problemen op te lossen door de gateway en DNS-server te controleren, lieten zien dat ze correct werkten. Controles op IP- of MAC-adresconflicten hebben geen gevonden. In de logboeken is de VIP-groep niet weergegeven. Er was een beperking voor het ophalen van de containerinstallatiekopie met behulp sudo docker pull ecpacr.azurecr.io/kube-vip:0.3.4 van, waardoor een TLS-time-out (Transport Layer Security) werd geretourneerd in plaats van niet-geautoriseerd.

Ga als volgt te werk om dit probleem op te lossen:

  1. Begin met het implementeren van uw cluster.
  2. Wanneer het cluster is geïmplementeerd, maakt u verbinding met uw beheercluster-VM via SSH, zoals hieronder wordt weergegeven:
ssh -i (Get-MocConfig)['sshPrivateKey'] clouduser@<IP Address>
  1. Wijzig de instelling voor de maximale transmissie-eenheid (MTU). Aarzel niet om de wijziging aan te brengen; Als u de wijziging te laat aanbrengt, mislukt de implementatie. Als u de MTU-instelling wijzigt, kunt u de pull van de containerinstallatiekopie deblokkeren.
sudo ifconfig eth0 mtu 1300
  1. Voer de volgende opdracht uit om de status van uw containers weer te geven:
sudo docker ps -a

Nadat u deze stappen hebt uitgevoerd, moet de pull-containerinstallatiekopie worden gedeblokkeerd.

Fout: 'Install-Moc is mislukt met fout - Uitzondering [kan de algemene rol van het failovercluster niet maken.]'

Deze fout geeft aan dat het IP-adres van de cloudservice geen deel uitmaakt van het clusternetwerk en niet overeenkomt met een van de clusternetwerken waarvoor de client and cluster communication rol is ingeschakeld.

U kunt dit probleem oplossen door Get-ClusterNetwork uit te voeren waarbij Role gelijk is ClusterAndClientaan . Selecteer vervolgens op een van de clusterknooppunten de naam, het adres en het adresmasker om te controleren of het IP-adres dat is opgegeven voor de -cloudServiceIP parameter van New-AksHciNetworkSetting overeenkomt met een van de weergegeven netwerken.

Volgende stappen

Als u problemen blijft ondervinden wanneer u AKS Arc gebruikt, kunt u fouten melden via GitHub.