本文說明使用由 Azure Arc 啟用的 AKS 時所發生的一些一般已知問題。您也可以檢閱已知問題,Windows Admin Center 和安裝問題和錯誤。
執行 AksHci PowerShell Cmdlet 時,會出現「無法載入 DLL」錯誤
防毒軟體可能會封鎖執行叢集作業所需的 PowerShell 二進位檔執行,因此導致此錯誤。 類似錯誤的範例如下所示:
若要解決此問題,請確認下列程式與資料夾 (執行 AKS 叢集作業所需的資料夾,) 會從防病毒軟體中排除:
流程:
- kubectl.exe
- kvactl.exe
- mocctl.exe
- nodectl.exe
- wssdagent.exe
- wssdcloudagent.exe
- kubectl-adsso.exe
- AksHciHealth.exe
資料夾:
- C:\Program Files\WindowsPowerShell\Modules\PowerShellGet\
- C:\Program Files\WindowsPowerShell\Modules\TraceProvider\
- C:\Program Files\WindowsPowerShell\Modules\AksHci\
- C:\Program Files\WindowsPowerShell\Modules\Az.Accounts\
- C:\Program Files\WindowsPowerShell\Modules\Az.Resources\
- C:\Program Files\WindowsPowerShell\Modules\AzureAD\
- C:\Program Files\WindowsPowerShell\Modules\DownloadSdk\
- C:\Program Files\WindowsPowerShell\Modules\Kva\
- C:\Program Files\WindowsPowerShell\Modules\Microsoft.SME.CredSspPolicy\
- C:\Program Files\WindowsPowerShell\Modules\Moc\
- C:\Program Files\WindowsPowerShell\Modules\PackageManagement\
- C:\Program Files\AksHci\
- C:\AksHci\
執行 Remove-AksHciCluster 會導致錯誤:「錯誤:無法刪除群組 clustergroup-spdb:...」
執行 AksHciCluster 時,會發生下列錯誤,因為可能有鎖死:
Error: unable to delete group clustergroup-spdb: failed to delete group clustergroup-spdb: rpc error: code = DeadlineExceeded desc = context deadline exceeded
若要解決此問題,請重新啟動 CloudAgent。
錯誤:invalid_client。 提供的用戶端密碼金鑰已過期
這個錯誤通常會發生在您執行 PowerShell Cmdlet 執行 Enable-AksHciArcConnection 時所使用的服務主體 (SPN) 祕密過期時。
請造訪 Azure 入口網站,為您的服務主體建立新的秘密, (SPN) 。 您也可以使用憑證認證來提高安全性。 如需使用 Cmdlet 的範例,請參閱 Enable-AksHciArcConnection。
「權限不足,無法完成此作業。」
當服務主體 (SPN) 或 Azure 認證 (使用者名稱和密碼時,通常會發生此錯誤) 用來連接 AKS 叢集的使用者名稱和密碼,在 Azure 訂用帳戶中沒有足夠的許可權來執行作業。
執行 Remove-AksHciCluster 會導致錯誤:「找不到名稱為 'my-workload-cluster' 的工作負載叢集」
Xxx
如果您在執行 Remove-AksHciCluster 時遇到此錯誤,請檢查確定您已使用正確的資訊來移除叢集。
傳輸:撥號 unix /var/run/moc-kms-plugin/kmsPlugin.sock: connect: 時發生錯誤,沒有這類檔案或目錄
當 AKS-HCI 目標叢集上的 KMS 外掛程式因為過期的 KMS 外掛程式令牌而停止執行時,就會發生此錯誤。
執行 Repair-AksHciCerts 以修正此問題。
在具有靜態 IP 位址的工作負載叢集中,節點中的所有 Pod 都會停滯在「容器建立」狀態
在具有靜態 IP 位址和 Windows 節點的工作負載叢集中,節點中的所有 Pod (包括 daemonset
pod) 停滯在 ContainerCreating 狀態。 嘗試使用 SSH 連線到該節點時,連線失敗併發生 Connection timed out
錯誤。
若要解決此問題,請使用 Hyper-V 管理員或故障轉移叢集管理員來關閉該節點的 VM。 在 5 到 10 分鐘之後,節點應該已重新建立,且所有 Pod 都會執行。
移動 AKS Arc 資源位置。
目前不支援在 AKS Arc 中移動資源。 您必須刪除 Kubernetes 叢集,然後將它重新部署至所需的位置。
後續步驟
如果您在 Azure Arc 啟用 AKS 時繼續遇到問題,您可以透過 GitHub 提出 Bug。