Mengatasi masalah dan kesalahan selama penginstalan AKS Arc

Berlaku untuk: AKS di Azure Stack HCI, AKS di Windows Server Artikel ini menjelaskan masalah dan kesalahan yang diketahui yang mungkin Anda temui saat menginstal AKS Arc. Anda juga dapat meninjau masalah yang diketahui saat memutakhirkan AKS Arc dan saat menggunakan Pusat Admin Windows.

Kesalahan "Gagal menunggu addon arc-onboarding"

Pesan kesalahan ini muncul setelah menjalankan Install-AksHci.

Catatan

Kesalahan mungkin disebabkan oleh mengaktifkan Private Link pada penyiapan. Saat ini, tidak ada solusi untuk skenario ini. AKS di HCI tidak berfungsi dengan Private Link.

Jika Anda tidak menggunakan Private Link, untuk mengatasi masalah ini, gunakan langkah-langkah berikut:

  1. Buka PowerShell dan jalankan Uninstall-AksHci.
  2. Buka portal Azure dan buka grup sumber daya yang Anda gunakan saat menjalankan Install-AksHci.
  3. Periksa sumber daya kluster yang terhubung yang muncul dalam status Terputus dan sertakan nama yang ditampilkan sebagai GUID yang dihasilkan secara acak.
  4. Hapus sumber daya kluster ini.
  5. Tutup sesi PowerShell dan buka sesi baru sebelum menjalankan Install-AksHci lagi.

Kesalahan: 'Install-AksHci Gagal, Layanan mengembalikan kesalahan. Kesalahan Status=403 Code="RequestDisallowedByPolicy"' saat menginstal AKS-HCI

Kesalahan ini mungkin disebabkan oleh proses penginstalan yang mencoba melanggar kebijakan Azure yang telah ditetapkan pada langganan Azure atau grup sumber daya yang disediakan selama proses onboarding Azure Arc. Kesalahan ini dapat terjadi bagi pengguna yang telah menentukan Azure Policy pada tingkat langganan atau grup sumber daya, dan kemudian mencoba menginstal AKS di Azure Stack HCI yang melanggar Azure Policy.

Untuk mengatasi masalah ini, baca pesan kesalahan untuk memahami Azure Policy mana yang ditetapkan oleh administrator Azure Anda yang telah dilanggar, lalu ubah kebijakan Azure dengan membuat pengecualian pada kebijakan Azure. Untuk mempelajari selengkapnya tentang pengecualian Kebijakan, lihat struktur pengecualian Azure Policy.

Kesalahan: Install-AksHci gagal dengan kesalahan - [Objek sudah ada] Terjadi kesalahan saat membuat sumber daya 'IPv4 Address xxx.xx.xx.xx' untuk peran terkluster 'xx-xxxxxxxxx-xxxx-xxxx-xxxx-xxxx-xxx'

Fitur yang dipasang sebelumnya tetap dalam status gagal dan belum dibersihkan. Anda mungkin melihat kesalahan berikut:

Exception [An error occurred while creating resource 'MOC Cloud Agent Service' for the clustered role 'ca-3f72bdeb-xxxx-4ae9-a721-3aa902a998f0'.]
Stacktrace [at Add-FailoverClusterGenericRole, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Common.psm1: line 2987
at Install-CloudAgent, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1310
at Install-MocAgents, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1229
at Initialize-Cloud, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1135
at Install-MocInternal, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1078
at Install-Moc, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 207
at Install-AksHciInternal, C:\Program Files\WindowsPowerShell\Modules\AksHci\1.1.25\AksHci.psm1: line 3867
at Install-AksHci, C:\Program Files\WindowsPowerShell\Modules\AksHci\1.1.25\AksHci.psm1: line 778
at <ScriptBlock>, <No file>: line 1]
InnerException[The object already exists]

Atau Anda mungkin melihat:

Install-Moc failed.
Exception [Unable to save property changes for 'IPv4 Address xxx.168.18.0'.]
Stacktrace [at Add-FailoverClusterGenericRole, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Common.psm1: line 2971
at Install-CloudAgent, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1310
at Install-MocAgents, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1229
at Initialize-Cloud, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1135
at Install-MocInternal, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 1078
at Install-Moc, C:\Program Files\WindowsPowerShell\Modules\Moc\1.0.20\Moc.psm1: line 207
at Install-AksHciInternal, C:\Program Files\WindowsPowerShell\Modules\AksHci\1.1.25\AksHci.psm1: line 3867
at Install-AksHci, C:\Program Files\WindowsPowerShell\Modules\AksHci\1.1.25\AksHci.psm1: line 778
at <ScriptBlock>, <No file>: line 1]
InnerException[A matching cluster network for the specified IP address could not be found]

Untuk mengatasi masalah ini, bersihkan peran kluster secara manual. Anda dapat menghapus sumber daya dari manajer kluster failover dengan menjalankan cmdlet PowerShell berikut: Remove-ClusterResource -name <resource name>.

Kesalahan: "Kesalahan GetRelease yang dikembalikan oleh panggilan API: Kesalahan pengunduhan file: Ketidakcocokan hash"

Install-AksHci Cmdlet gagal dengan "Kesalahan GetRelease yang dikembalikan oleh panggilan API: Kesalahan pengunduhan file: Ketidakcocokan hash."

  1. Buka PowerShell dan jalankan Uninstall-AksHci.
  2. Coba lagi penginstalan.
  3. Jika masalah berlanjut, gunakan -concurrentDownloads parameter dengan Set-AksHciConfig dan atur ke angka yang lebih rendah dari default 10 sebelum mencoba kembali penginstalan. Mengurangi jumlah unduhan bersamaan dapat membantu jaringan sensitif menyelesaikan unduhan file besar dengan sukses. Parameter ini adalah fitur pratinjau.

Setelah menyebarkan AKS di Azure Stack HCI 21H2, boot ulang simpul menunjukkan status gagal untuk penagihan

Setelah penyebaran, saat me-reboot node Azure Stack HCI, laporan AKS menunjukkan status gagal untuk tagihan.

Untuk mengatasi masalah ini, ikuti petunjuk untuk memutar token secara manual dan menghidupkan ulang plug-in KMS.

Waktu install-AksHci habis dengan kesalahan ''

Setelah menjalankan Install-AksHci, penginstalan berhenti dan menampilkan pesan kesalahan berikut:

\kubectl.exe --kubeconfig=C:\AksHci\0.9.7.3\kubeconfig-clustergroup-management 
get akshciclusters -o json returned a non zero exit code 1 
[Unable to connect to the server: dial tcp 192.168.0.150:6443: 
connectex: A connection attempt failed because the connected party 
did not properly respond after a period of time, or established connection 
failed because connected host has failed to respond.]

Ada beberapa alasan mengapa penginstalan mungkin gagal dengan kesalahan waiting for API server.

Bagian berikut menguraikan kemungkinan penyebab dan solusi untuk kesalahan ini.

Alasan 1: Konfigurasi gateway IP yang salah Jika Anda menggunakan alamat IP statis dan Anda menerima pesan kesalahan berikut, konfirmasikan bahwa konfigurasi untuk alamat IP dan gateway sudah benar.

Install-AksHci 
C:\AksHci\kvactl.exe create --configfile C:\AksHci\yaml\appliance.yaml  --outfile C:\AksHci\kubeconfig-clustergroup-management returned a non-zero exit code 1 [ ]

Untuk memeriksa apakah Anda memiliki konfigurasi yang tepat untuk alamat IP dan gateway Anda, jalankan perintah berikut:

ipconfig /all

Dalam pengaturan konfigurasi yang ditampilkan, konfirmasi konfigurasi. Anda juga dapat mencoba melakukan ping gateway IP dan server DNS.

ping <DNS server>

Jika metode ini tidak berfungsi, gunakan New-AksHciNetworkSetting untuk mengubah konfigurasi.

Alasan 2: Server DNS yang salah Jika Anda menggunakan alamat IP statis, konfirmasikan bahwa server DNS dikonfigurasi dengan benar. Untuk memeriksa alamat server DNS host, gunakan perintah berikut:

Get-NetIPConfiguration.DNSServer | ?{ $_.AddressFamily -ne 23} ).ServerAddresses

Konfirmasikan bahwa alamat server DNS sama dengan alamat yang digunakan saat menjalankan New-AksHciNetworkSetting dengan menjalankan perintah berikut:

Get-MocConfig

Jika server DNS salah dikonfigurasi, instal ulang AKS di Azure Stack HCI dengan server DNS yang benar. Untuk informasi selengkapnya, lihat Memulai ulang, menghapus, atau menginstal ulang AKS di Azure Stack HCI .

Masalah berhasil diselesaikan setelah menghapus konfigurasi dan memulai ulang VM dengan konfigurasi baru.

Kesalahan: "Proses tidak dapat mengakses file 'mocstack.cab' karena sedang digunakan oleh proses lain"

Install-AksHci gagal dengan kesalahan ini karena proses lain sedang mengakses mocstack.cab.

Untuk mengatasi masalah ini, tutup semua jendela PowerShell yang terbuka lalu buka kembali jendela PowerShell baru.

Kesalahan: Install-AksHci gagal dengan 'Install-MOC gagal dengan kesalahan - proses tidak dapat mengakses file \<path> karena sedang digunakan oleh proses lain.'

File tidak dapat diakses karena sedang digunakan oleh proses lain.

Anda dapat mengatasi masalah ini dengan memulai ulang sesi PowerShell. Tutup jendela PowerShell dan coba Install-AksHci lagi.

Kesalahan: "Koneksi yang ada ditutup secara paksa oleh host jarak jauh"

Install-AksHci gagal dengan kesalahan ini karena rentang kumpulan IP yang disediakan dalam konfigurasi AKS di Azure Stack HCI dinonaktifkan oleh 1 di CIDR, dan dapat menyebabkan CloudAgent mengalami crash. Misalnya, jika Anda memiliki subnet 10.0.0.0/21 dengan rentang alamat 10.0.0.0 - 10.0.7.255, lalu Anda menggunakan alamat mulai 10.0.0.1 atau alamat akhir 10.0.7.254, maka ini akan menyebabkan CloudAgent crash.

Untuk mengatasi masalah ini, jalankan New-AksHciNetworkSetting, dan gunakan rentang alamat IP lain yang valid untuk kumpulan VIP dan kumpulan simpul Kubernetes Anda. Pastikan bahwa nilai yang Anda gunakan tidak nonaktif oleh 1 di awal atau akhir rentang alamat.

Install-AksHci gagal pada penginstalan multi-simpul dengan kesalahan 'Node belum mencapai status aktif'

Saat menjalankan Install-AksHci pada penyiapan satu node, penginstalan berfungsi, tetapi saat menyiapkan kluster failover, penginstalan gagal dengan pesan kesalahan tersebut. Namun, ping agen cloud menunjukkan CloudAgent dapat dijangkau.

Untuk memastikan semua node dapat menyelesaikan DNS CloudAgent, jalankan perintah berikut pada setiap node:

Resolve-DnsName <FQDN of cloudagent>

Ketika langkah di atas berhasil pada node, pastikan node dapat mencapai port CloudAgent untuk memverifikasi bahwa proksi tidak mencoba untuk memblokir koneksi ini dan port terbuka. Untuk melakukannya, jalankan perintah berikut pada setiap node:

Test-NetConnection  <FQDN of cloudagent> -Port <Cloudagent port - default 65000>

Paket unduhan AKS di Azure Stack HCI gagal dengan kesalahan: 'msft.sme.aks tidak dapat memuat'

Kesalahan berasal dari kesalahan dengan unduhan.

Jika Anda mendapatkan kesalahan ini, Anda harus menggunakan versi terbaru Microsoft Edge atau Google Chrome dan mencoba lagi.

Saat menjalankan Set-AksHciRegistration, kesalahan 'Tidak dapat memeriksa Penyedia Sumber Daya terdaftar' muncul

Kesalahan ini muncul setelah menjalankan Set-AksHciRegistration dalam penginstalan AKS di Azure Stack HCI. Kesalahan tersebut menunjukkan bahwa Penyedia Sumber Kubernetes tidak terdaftar untuk penyewa yang saat ini masuk.

Untuk mengatasi masalah ini, jalankan langkah-langkah Azure CLI atau PowerShell di bawah ini:

az provider register --namespace Microsoft.Kubernetes
az provider register --namespace Microsoft.KubernetesConfiguration
Register-AzResourceProvider -ProviderNamespace Microsoft.Kubernetes
Register-AzResourceProvider -ProviderNamespace Microsoft.KubernetesConfiguration

Pendaftaran memakan waktu sekitar 10 menit hingga selesai. Untuk memantau proses pendaftaran, gunakan perintah berikut.

az provider show -n Microsoft.Kubernetes -o table
az provider show -n Microsoft.KubernetesConfiguration -o table
Get-AzResourceProvider -ProviderNamespace Microsoft.Kubernetes
Get-AzResourceProvider -ProviderNamespace Microsoft.KubernetesConfiguration

Install-AksHci macet di tahap 'Menunggu azure-arc-onboarding selesai' sebelum waktu habis

Catatan

Masalah ini diperbaiki dalam rilis Mei 2022 dan yang lebih baru.

Install-AksHci macet pada Waiting for azure-arc-onboarding to complete sebelum waktu habis ketika:

  • Perwakilan layanan digunakan dalam Pendaftaran AKS di Azure Stack HCI (Set-AksHciRegistration).
  • Modul Az.Accounts PowerShell versi(2.7.x) diinstal.

Az.Accounts 2.7.x versi menghapus ServicePrincipalSecret dan CertificatePassword di PSAzureRmAccount, yang digunakan oleh AKS di Azure Stack HCI untuk onboarding Azure Arc.

Untuk mereproduksi:

  1. Instal Az.Accounts modul PowerShell versi (>= 2.7.0).
  2. Set-AksHciRegistration menggunakan perwakilan layanan.
  3. Install-AksHci.

Perilaku yang diharapkan:

  1. Penginstalan AKS di Azure Stack HCI macet pada Waiting for azure-arc-onboarding to complete.
  2. Azure-arc-onboarding pod masuk ke perulangan crash.
  3. Azure-arc-onboarding pod mengalami kesalahan dengan kesalahan berikut:
    Starting onboarding process ERROR: variable CLIENT_SECRET is required

Untuk mengatasi masalah ini:

Hapus instalan modul Az.Accounts dengan versi 2.7.x. menjalankan cmdlet berikut:

Uninstall-Module -Name Az.Accounts -RequiredVersion 2.7.0 -Force

Selama penginstalan, kesalahan ini muncul: 'tidak dapat membuat VM appliance: tidak dapat membuat komputer virtual: kesalahan rpc = desc tidak diketahui = Terjadi pengecualian. (Kegagalan generik)]'

Kesalahan ini terjadi ketika Azure Stack HCI tidak ada dalam kebijakan. Status koneksi pada kluster mungkin menunjukkan bahwa itu terhubung, tetapi log peristiwa menunjukkan pesan peringatan bahwa Azure Stack HCI's subscription is expired, run Sync-AzureStackHCI to renew the subscription.

Untuk mengatasi kesalahan ini, verifikasi bahwa kluster terdaftar di Azure menggunakan cmdlet PowerShell Get-AzureStackHCI yang tersedia di komputer Anda. Dasbor Windows Admin Center juga menampilkan informasi status tentang pendaftaran Azure kluster.

Jika kluster sudah terdaftar, Anda akan melihat bidang LastConnected dalam output Get-AzureStackHCI. Jika bidang menunjukkan sudah lebih dari 30 hari, sebaiknya coba selesaikan situasi ini menggunakan cmdlet Sync-AzureStackHCI.

Anda juga dapat memvalidasi apakah setiap node kluster Anda memiliki lisensi yang diperlukan dengan menggunakan cmdlet berikut:

Get-ClusterNode | % { Get-AzureStackHCISubscriptionStatus -ComputerName $_ }
Computer Name Subscription Name           Status   Valid To
------------- -----------------           ------   --------
MS-HCIv2-01   Azure Stack HCI             Active   12/23/2021 12:00:14 AM
MS-HCIv2-01   Windows Server Subscription Inactive

MS-HCIv2-02   Azure Stack HCI             Active   12/23/2021 12:00:14 AM
MS-HCIv2-02   Windows Server Subscription Inactive

MS-HCIv2-03   Azure Stack HCI             Active   12/23/2021 12:00:14 AM
MS-HCIv2-03   Windows Server Subscription Inactive

Jika masalah tidak diselesaikan setelah menjalankan cmdlet Sync-AzureStackHCI, sebaiknya hubungi dukungan Microsoft.

Setelah penginstalan gagal, menjalankan Install-AksHci tidak berfungsi

Masalah ini terjadi karena penginstalan yang gagal dapat mengakibatkan kebocoran sumber daya yang harus dibersihkan sebelum Anda dapat menginstal lagi.

Jika penginstalan Anda gagal menggunakan Install-AksHci, Anda harus menjalankan Uninstall-AksHci sebelum menjalankan Install-AksHci lagi.

Kesalahan: "tidak dapat mendamaikan jaringan virtual" atau "Kesalahan: Install-Moc gagal dengan kesalahan - Pengecualian [[Moc] Komputer ini tampaknya tidak dikonfigurasi untuk penyebaran]"

Anda dapat memicu kesalahan ini saat menjalankan Install-AksHci tanpa menjalankan Set-AksHciConfig terlebih dahulu.

Untuk mengatasi kesalahan tersebut, jalankan uninstall-akshci dan tutup semua jendela PowerShell. Buka sesi PowerShell baru, dan mulai ulang proses penginstalan AKS-HCI Anda dengan mengikuti menginstal AKS-HCI menggunakan PowerShell.

Set-AksHciConfig gagal dengan kesalahan "Kesalahan GetCatalog yang dikembalikan oleh panggilan API: ... proxyconnect tcp: tls: rekaman pertama tidak terlihat seperti Jabat Tangan TLS"

Set-AksHciConfig Cmdlet PowerShell gagal dengan kesalahan:

GetCatalog error returned by API call: ... proxyconnect tcp: tls: first record does not look like a TLS Handshake

Jika Anda menggunakan AKS dengan server proksi, Anda mungkin telah menggunakan URL yang salah saat mengatur nilai URL proksi HTTPS yang diperlukan. NILAI URL proksi HTTP dan URL proksi HTTPS keduanya diperlukan saat mengonfigurasi AKS dengan server proksi, tetapi umumnya memerlukan kedua nilai untuk berbagi URL awalan HTTP yang sama.

Jika ini mungkin terjadi di lingkungan Anda, coba langkah-langkah mitigasi berikut:

  1. Tutup jendela PowerShell dan buka yang baru.
  2. Jalankan New-AksHciNetworkSetting cmdlet dan New-AksHciProxySetting lagi. Saat menjalankan New-AksHciProxySetting, atur -https parameter dengan nilai URL awalan HTTP yang sama yang Anda tetapkan untuk -http.
  3. Jalankan Set-AksHciConfig dan lanjutkan.

Saat Anda menyebarkan AKS di Azure Stack HCI dengan jaringan yang salah dikonfigurasi, waktu penyebaran habis di berbagai titik

Saat Anda menyebarkan AKS di Azure Stack HCI, penyebaran mungkin kehabisan waktu di titik proses yang berbeda tergantung di mana kesalahan konfigurasi terjadi. Anda harus meninjau pesan kesalahan untuk menentukan penyebab dan di mana terjadinya.

Misalnya, dalam kesalahan berikut, titik tempat kesalahan konfigurasi terjadi berada di Get-DownloadSdkRelease -Name "mocstack-stable":

$vnet = New-AksHciNetworkSettingSet-AksHciConfig -vnet $vnetInstall-AksHciVERBOSE: 
Initializing environmentVERBOSE: [AksHci] Importing ConfigurationVERBOSE: 
[AksHci] Importing Configuration Completedpowershell : 
GetRelease - error returned by API call: 
Post "https://msk8s.api.cdp.microsoft.com/api/v1.1/contents/default/namespaces/default/names/mocstack-stable/versions/0.9.7.0/files?action=generateDownloadInfo&ForegroundPriority=True": 
dial tcp 52.184.220.11:443: connectex: 
A connection attempt failed because the connected party did not properly
respond after a period of time, or established connection failed because
connected host has failed to respond.At line:1 char:1+ powershell -command
{ Get-DownloadSdkRelease -Name "mocstack-stable"}

Hal ini menunjukkan bahwa node fisik Azure Stack HCI dapat menyelesaikan nama URL unduhan, msk8s.api.cdp.microsoft.com, tetapi node tidak dapat terhubung ke server target.

Untuk mengatasi masalah ini, Anda perlu menentukan di mana kerusakan terjadi dalam alur koneksi. Berikut adalah beberapa langkah untuk mencoba menyelesaikan masalah dari node kluster fisik:

  1. Ping nama DNS tujuan: ping msk8s.api.cdp.microsoft.com.
  2. Jika Anda mendapatkan respons kembali dan tidak ada waktu habis, artinya jalur jaringan dasar berfungsi.
  3. Jika waktu koneksi habis, kemungkinan ada kerusakan di jalur data. Untuk informasi selengkapnya, lihat memeriksa pengaturan proksi. Selain itu, mungkin ada kerusakan di jalur pengembalian, jadi Anda harus memeriksa aturan firewall.

Set-AksHciConfig gagal dengan kesalahan WinRM, tetapi menunjukkan WinRM dikonfigurasi dengan benar

Saat menjalankan Set-AksHciConfig, Anda mungkin mengalami kesalahan berikut:

WinRM service is already running on this machine.
WinRM is already set up for remote management on this computer.
Powershell remoting to TK5-3WP08R0733 was not successful.
At C:\Program Files\WindowsPowerShell\Modules\Moc\0.2.23\Moc.psm1:2957 char:17
+ ...             throw "Powershell remoting to "+$env:computername+" was n ...
+                 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
    + CategoryInfo          : OperationStopped: (Powershell remo...not successful.:String) [], RuntimeException
    + FullyQualifiedErrorId : Powershell remoting to TK5-3WP08R0733 was not successful.

Kesalahan ini biasanya terjadi sebagai akibat dari perubahan token keamanan pengguna (karena perubahan keanggotaan grup), perubahan kata sandi, atau kata sandi kedaluwarsa. Dalam kebanyakan kasus, masalah dapat diperbaiki dengan keluar dari komputer dan masuk kembali. Jika masih gagal, Anda dapat mengajukan masalah di masalah GitHub AKS HCI.

Rotasi log agen moc gagal

Agen MOC diharapkan hanya menyimpan 100 log agen terakhir. Agen MOC seharusnya menghapus log yang lebih lama. Namun, rotasi log tidak terjadi dan log terus terakumulasi sehingga menghabiskan ruang disk.

Untuk mereproduksi: Install AksHci dan memiliki kluster berjalan sampai jumlah log agen melebihi 100. Pada saat pembuatan log ke-n, agen diharapkan untuk menghapus log ke-100, jika ada.

Untuk mengatasi masalah ini:

  1. Ubah file logconf agen cloud dan agen node. logconfig agen cloud berada di:
    (Get-MocConfig).cloudConfigLocation+"\log\logconf".
    Agen simpul logconfig berada di:
    (Get-MocConfig).cloudConfigLocation+"\log\logconf".

  2. Ubah nilai Batas menjadi 100 dan Slot menjadi 100 dan simpan file konfigurasi.

  3. Mulai ulang agen cloud dan agen node untuk mendaftarkan perubahan ini.

Langkah-langkah ini memulai rotasi log hanya setelah 100 log baru dihasilkan dari mulai ulang agen. Jika sudah ada n log agen pada saat mulai ulang, rotasi log akan dimulai hanya setelah n+100 log dihasilkan.

Agen cloud mungkin gagal memulai saat menggunakan nama jalur dengan spasi di dalamnya

Saat menggunakan Set-AksHciConfig untuk menentukan parameter -imageDir, -workingDir, -cloudConfigLocation, atau -nodeConfigLocation dengan nama jalur yang berisi karakter spasi, seperti D:\Cloud Share\AKS HCI, layanan kluster agen cloud akan gagal memulai dengan pesan kesalahan berikut (atau serupa):

Failed to start the cloud agent generic cluster service in failover cluster. The cluster resource group os in the 'failed' state. Resources in 'failed' or 'pending' states: 'MOC Cloud Agent Service'

Untuk mengatasi masalah ini, gunakan jalur yang tidak menyertakan spasi, misalnya, C:\CloudShare\AKS-HCI.

Kesalahan: 'Install-Moc gagal dengan kesalahan - Pengecualian [CloudAgent tidak dapat dijangkau. MOC CloudAgent mungkin tidak dapat dijangkau karena alasan berikut]'

Kesalahan ini dapat terjadi ketika ada kesalahan konfigurasi infrastruktur.

Gunakan langkah-langkah berikut untuk mengatasi kesalahan ini:

  1. Periksa konfigurasi server DNS host dan pengaturan gateway:

    1. Konfirmasikan bahwa server DNS dikonfigurasi dengan benar. Untuk memeriksa alamat server DNS host, jalankan perintah berikut:
      ((Get-NetIPConfiguration).DNSServer | ?{ $_.AddressFamily -ne 23}).ServerAddresses
      
    2. Untuk memeriksa apakah alamat IP dan konfigurasi gateway Anda benar, jalankan perintah ipconfig/all.
    3. Cobalah untuk ping gateway IP dan server DNS.
  2. Periksa layanan CloudAgent untuk memastikannya berjalan:

    1. Ping layanan CloudAgent untuk memastikannya dapat dijangkau.
    2. Pastikan semua simpul dapat mengatasi DNS CloudAgent dengan menjalankan perintah berikut pada setiap simpul:
      Resolve-DnsName <FQDN of cloudagent>
      
    3. Ketika langkah sebelumnya berhasil pada node, pastikan node dapat mencapai port CloudAgent untuk memverifikasi bahwa proksi tidak mencoba untuk memblokir koneksi ini dan port terbuka. Untuk melakukannya, jalankan perintah berikut pada setiap node:
      Test-NetConnection <FQDN of cloudagent> -Port <Cloudagent port - default 65000>
      
    4. Untuk memeriksa apakah layanan kluster berjalan untuk kluster failover, Anda juga dapat menjalankan perintah berikut:
      Get-ClusterGroup -Name (Get-AksHciConfig).Moc['clusterRoleName']
      

Kesalahan: 'Install-Moc gagal. Pengecualian [Ini biasanya menunjukkan masalah yang terjadi saat mendaftarkan nama sumber daya sebagai objek komputer dengan pengendali domain dan/atau server DNS. Silakan periksa apakah Objek Komputer Kluster memiliki izin untuk membuat Objek Komputer di pengendali domain. Silakan periksa pengendali domain dan log DNS untuk pesan kesalahan terkait.'

Ini biasanya menunjukkan bahwa Objek Nama Kluster (CNO) yang mewakili kluster failover dasar Anda di Active Directory Domain Services (AD DS) tidak memiliki izin untuk membuat Objek Komputer Virtual (VCO) di Unit Organisasi (OU) atau dalam kontainer tempat kluster berada.

Jika Anda bukan administrator domain, Anda dapat meminta seseorang untuk memberikan izin CNO ke OU atau melakukan prestage VCO untuk layanan kluster generik agen cloud.

Jika Anda adalah administrator domain, masih mungkin bahwa unit organisasi atau kontainer Anda tidak memiliki izin yang diperlukan. Misalnya, mode Penegakan, yang diperkenalkan dalam KB5008383, dapat diaktifkan di Direktori Aktif. Coba yang berikut ini sebelum mencoba menginstal ulang.

  1. Navigasikan ke Pengguna direktori aktif dan Komputer.
  2. Klik kanan pada OU atau kontainer tempat kluster berada.
  3. Pilih Delegasikan Kontrol... untuk membuka Delegasi Panduan Kontrol.
  4. Klik Berikutnya> Klik Tambahkan... untuk membuka jendela Pilih Pengguna, Komputer, atau Grup .
  5. Pilih pilihan grup atau pengguna yang ingin Anda delegasikan kontrolnya > Klik OK.
  6. Pilih Buat tugas kustom untuk mendelegasikan> Klik Berikutnya untuk melanjutkan ke halaman Tipe Objek Direktori Aktif.
  7. Pilih Hanya objek berikut dalam folder> Pilih Objek> komputer Pilih Buat objek terpilih di folder ini dan Hapus objek terpilih di folder> ini Klik Berikutnya untuk berpindah ke halaman Izin.
  8. Pilih Buat semua Objek Anak dan Hapus Semua Objek Anak dari daftar izin > Klik Selesai Berikutnya>

Jika penginstalan ulang gagal, coba lagi hal di atas dengan perubahan berikut pada Langkah 7 dan 8:

  • Langkah 7: Pilih Folder ini, objek yang ada di folder ini, dan pembuatan objek baru di folder> ini Klik Berikutnya.
  • Langkah 8: Pilih Baca, Tulis, Buat Semua Objek Anak, dan Hapus Semua Objek Turunan dari daftar izin > Klik Berikutnya> Klik Selesai.

Kesalahan: Install-AksHci gagal dengan 'Install-Moc gagal. Log tersedia C:\Users\xxx\AppData\Local\Temp\v0eoltcc.a10'

Anda mungkin menerima kesalahan ini saat menjalankan Install-AksHci.

Anda bisa mendapatkan informasi lebih lanjut dengan menjalankan $error = Install-AksHci lalu $error[0].Exception.InnerException.

Penyebaran PowerShell tidak memeriksa memori yang tersedia sebelum membuat kluster beban kerja baru

Perintah Aks-Hci PowerShell tidak memvalidasi memori yang tersedia di server host sebelum membuat node Kubernetes. Masalah ini dapat menyebabkan penghabisan memori dan mesin virtual yang tidak bisa dimulai. Kegagalan ini saat ini tidak ditangani dengan baik, dan penyebaran akan berhenti merespons tanpa pesan kesalahan yang jelas.

Jika Anda memiliki penyebaran yang berhenti merespons, buka Pemantau Peristiwa dan periksa pesan kesalahan terkait Hyper-V yang menunjukkan bahwa memori tidak cukup untuk memulai mesin virtual.

Kesalahan 'Tidak dapat memperoleh token' muncul saat menjalankan Set-AksHciRegistration

Kesalahan ini dapat terjadi ketika Anda memiliki beberapa penyewa di akun Azure Anda.

Gunakan $tenantId = (Get-AzContext).Tenant.Id untuk mengatur penyewa yang tepat. Kemudian, sertakan penyewa ini sebagai parameter saat menjalankan Set-AksHciRegistration.

Kesalahan: 'Menunggu pod 'Operator Cloud' siap'

Saat mencoba menyebarkan kluster AKS pada Azure VM, penginstalan macet di Waiting for pod 'Cloud Operator' to be ready..., lalu gagal dan kehabisan waktu setelah dua jam. Upaya untuk memecahkan masalah dengan memeriksa gateway dan server DNS menunjukkan bahwa keduanya bekerja dengan tepat. Memeriksa konflik alamat IP atau MAC tidak menemukan apa pun. Log tidak menunjukkan kumpulan VIP. Ada pembatasan untuk menarik citra kontainer menggunakan sudo docker pull ecpacr.azurecr.io/kube-vip:0.3.4 yang menampilkan waktu habis Keamanan Lapisan Transportasi (TLS) alih-alih tidak diotorisasi.

Untuk mengatasi masalah ini, lakukan langkah-langkah berikut:

  1. Mulailah menyebarkan kluster Anda.
  2. Saat kluster disebarkan, sambungkan ke VM kluster manajemen Anda melalui SSH seperti yang ditunjukkan di bawah ini:
ssh -i (Get-MocConfig)['sshPrivateKey'] clouduser@<IP Address>
  1. Ubah pengaturan unit transmisi maksimum (MTU). Jangan ragu untuk membuat perubahan; jika Anda membuat perubahan terlambat, penyebaran gagal. Mengubah pengaturan MTU membantu membatalkan blokir penarikan citra kontainer.
sudo ifconfig eth0 mtu 1300
  1. Untuk melihat status kontainer Anda, jalankan perintah berikut:
sudo docker ps -a

Setelah Anda melakukan langkah-langkah ini, penarikan gambar kontainer harus dibuka blokirnya.

Kesalahan: 'Install-Moc gagal dengan kesalahan - Pengecualian [Tidak dapat membuat peran generik kluster failover.]'

Kesalahan ini menunjukkan bahwa alamat IP layanan cloud bukan bagian dari jaringan kluster dan tidak cocok dengan jaringan kluster mana pun yang memiliki peran client and cluster communication yang diaktifkan.

Untuk mengatasi masalah ini, jalankan Get-ClusterNetwork di mana Role sama dengan ClusterAndClient. Kemudian, pada salah satu node kluster, pilih nama, alamat, dan masker alamat untuk memverifikasi bahwa alamat IP yang disediakan untuk parameter -cloudServiceIP dari New-AksHciNetworkSetting cocok dengan salah satu jaringan yang ditampilkan.

Cmdlet Enable-AksHciArcConnection menghasilkan peringatan yang menunjukkan bahwa GetServicePrincipals memiliki hak istimewa yang tidak memadai untuk mengaktifkan lokasi kustom

Enable-AksHciArcConnection dapat menyambungkan kluster AKS ke Azure, tetapi menunjukkan peringatan berikut saat pelanggan menggunakan perwakilan layanan untuk autentikasi:

WARNING: Error occurred while executing GetServicePrincipals
Code: Authorization_RequestDenied
Message: Insufficient privileges to complete the operation.
RequestId: <removed>
DateTimeStamp: <removed>
HttpStatusCode: Forbidden
HttpStatusDescription: Forbidden
HttpResponseStatus: Completed
WARNING: Custom locations has not been enabled on the AKS-HCI cluster. To enable custom locations manually, visit aka.ms/enable-custom-location

Perilaku onboarding Arc saat ini adalah mengaktifkan lokasi kustom secara default. Untuk mengaktifkan lokasi kustom, tindakan GetServicePrincipals dilakukan dalam konteks pengguna Azure yang masuk. Jika pengguna (atau SPN) tidak memiliki izin yang memadai untuk dapat melakukan ini, perintah mengeluarkan peringatan bahwa izin ini tidak ada, dan oleh karena itu fitur Lokasi Kustom tidak akan diaktifkan.

Jika Anda tidak ingin Lokasi Kustom diaktifkan, Anda dapat mengabaikan peringatan ini dengan aman, karena ini tidak memengaruhi onboarding kluster ke Arc. Di sisi lain, jika Anda memerlukan Lokasi Kustom untuk diaktifkan, Anda harus memberikan izin yang diperlukan kepada pengguna (atau SPN).

Langkah berikutnya

Jika Anda terus mengalami masalah saat menggunakan AKS Arc, Anda dapat mengajukan bug melalui GitHub.