解決使用由 Azure Arc 啟用的 AKS 時的一般問題

本文說明使用由 Azure Arc 啟用的 AKS 時所發生的一些一般已知問題。您也可以檢閱已知問題,Windows Admin Center安裝問題和錯誤

執行 AksHci PowerShell Cmdlet 時,會出現「無法載入 DLL」錯誤

防毒軟體可能會封鎖執行叢集作業所需的 PowerShell 二進位檔執行,因此導致此錯誤。 類似錯誤的範例如下所示:

部署:連線到遠端伺服器localhost失敗。

若要解決此問題,請確認下列程式與資料夾 (執行 AKS 叢集作業所需的資料夾,) 會從防病毒軟體中排除:

流程:

  • kubectl.exe
  • kvactl.exe
  • mocctl.exe
  • nodectl.exe
  • wssdagent.exe
  • wssdcloudagent.exe
  • kubectl-adsso.exe
  • AksHciHealth.exe

資料夾:

  • C:\Program Files\WindowsPowerShell\Modules\PowerShellGet\
  • C:\Program Files\WindowsPowerShell\Modules\TraceProvider\
  • C:\Program Files\WindowsPowerShell\Modules\AksHci\
  • C:\Program Files\WindowsPowerShell\Modules\Az.Accounts\
  • C:\Program Files\WindowsPowerShell\Modules\Az.Resources\
  • C:\Program Files\WindowsPowerShell\Modules\AzureAD\
  • C:\Program Files\WindowsPowerShell\Modules\DownloadSdk\
  • C:\Program Files\WindowsPowerShell\Modules\Kva\
  • C:\Program Files\WindowsPowerShell\Modules\Microsoft.SME.CredSspPolicy\
  • C:\Program Files\WindowsPowerShell\Modules\Moc\
  • C:\Program Files\WindowsPowerShell\Modules\PackageManagement\
  • C:\Program Files\AksHci\
  • C:\AksHci\

執行 Remove-AksHciCluster 會導致錯誤:「錯誤:無法刪除群組 clustergroup-spdb:...」

執行 AksHciCluster 時,會發生下列錯誤,因為可能有鎖死:

Error: unable to delete group clustergroup-spdb: failed to delete group clustergroup-spdb: rpc error: code = DeadlineExceeded desc = context deadline exceeded

若要解決此問題,請重新啟動 CloudAgent。

錯誤:invalid_client。 提供的用戶端密碼金鑰已過期

這個錯誤通常會發生在您執行 PowerShell Cmdlet 執行 Enable-AksHciArcConnection 時所使用的服務主體 (SPN) 祕密過期時。

請造訪 Azure 入口網站,為您的服務主體建立新的秘密, (SPN) 。 您也可以使用憑證認證來提高安全性。 如需使用 Cmdlet 的範例,請參閱 Enable-AksHciArcConnection

「權限不足,無法完成此作業。」

當服務主體 (SPN) 或 Azure 認證 (使用者名稱和密碼時,通常會發生此錯誤) 用來連接 AKS 叢集的使用者名稱和密碼,在 Azure 訂用帳戶中沒有足夠的許可權來執行作業。

檢閱 Azure Arc 所啟用 AKS 中 Kubernetes 叢集的 Azure 需求中的許可權需求。

執行 Remove-AksHciCluster 會導致錯誤:「找不到名稱為 'my-workload-cluster' 的工作負載叢集」

Xxx

如果您在執行 Remove-AksHciCluster 時遇到此錯誤,請檢查確定您已使用正確的資訊來移除叢集。

傳輸:撥號 unix /var/run/moc-kms-plugin/kmsPlugin.sock: connect: 時發生錯誤,沒有這類檔案或目錄

當 AKS-HCI 目標叢集上的 KMS 外掛程式因為過期的 KMS 外掛程式令牌而停止執行時,就會發生此錯誤。

執行 Repair-AksHciCerts 以修正此問題。

在具有靜態 IP 位址的工作負載叢集中,節點中的所有 Pod 都會停滯在「容器建立」狀態

在具有靜態 IP 位址和 Windows 節點的工作負載叢集中,節點中的所有 Pod (包括 daemonset pod) 停滯在 ContainerCreating 狀態。 嘗試使用 SSH 連線到該節點時,連線失敗併發生 Connection timed out 錯誤。

若要解決此問題,請使用 Hyper-V 管理員或故障轉移叢集管理員來關閉該節點的 VM。 在 5 到 10 分鐘之後,節點應該已重新建立,且所有 Pod 都會執行。

移動 AKS Arc 資源位置。

目前不支援在 AKS Arc 中移動資源。 您必須刪除 Kubernetes 叢集,然後將它重新部署至所需的位置。

後續步驟

如果您在 Azure Arc 啟用 AKS 時繼續遇到問題,您可以透過 GitHub 提出 Bug。