由于 AKS Arc 映像出现问题,无法创建 AKS 群集或缩放节点池

适用于:Azure Local 上的 AKS

症状

尝试创建 AKS 群集时,会看到以下错误:

Kubernetes version 1.29.4 is not ready for use on Linux. Please go to https://aka.ms/aksarccheckk8sversions for details of how to check the readiness of Kubernetes versions.

尝试缩放节点池时,也可能看到以下错误:

error with code NodepoolPrecheckFailed occured: AksHci nodepool creation precheck failed. Detailed message: 1 error occurred:\n\t* rpc error: code = Unknown desc = GalleryImage not usable, health state degraded: Degraded

运行 az aksarc get-versions时,会看到以下错误:

...
              {

                "errorMessage": "failed cloud-side provisioning image linux-cblmariner-0.4.1.11203 to cloud gallery: {\n  \"code\": \"ImageProvisionError\",\n  \"message\": \"force failed to deprovision existing gallery image: failed to delete gallery image linux-cblmariner-0.4.1.11203: rpc error: code = Unknown desc = sa659p1012: rpc error: code = Unavailable desc = connection error: desc = \\\"transport: Error while dialing: dial tcp 10.202.244.4:45000: connectex: A connection attempt failed because the connected party did not properly respond after a period of time, or established connection failed because connected host has failed to respond.\\\"\",\n  \"additionalInfo\": [\n   {\n    \"type\": \"providerImageProvisionInfo\",\n    \"info\": {\n     \"ProviderDownload\": \"True\"\n    }\n   }\n  ],\n  \"category\": \"\"\n }",
                "osSku": "CBLMariner",
                "osType": "Linux",
                "ready": false
              },
...

缓解措施

  • 此问题已在 Azure 本地版本 2503 上的 AKS 中修复。
  • 将 Azure 本地部署升级到 2503 版本。
  • 更新后,通过运行以下命令 az aksarc get-versions 确认映像已成功下载。
  • 对于新的 AKS 群集:现在应该可以成功创建新的 AKS 群集。
  • 对于缩放现有 AKS 群集:缩放现有 AKS 群集仍会遇到问题。 请提交支持案例。

后续步骤

Azure Arc 启用的 AKS 中的已知问题