分享方式:


針對 AKS 上的 HDInsight 中之 Apache Flink® 叢集組態進行疑難排解

注意

AKS 上的 Azure HDInsight 將於 2025 年 1 月 31 日退場。 請於 2025 年 1 月 31 日之前,將工作負載移轉至 Microsoft Fabric 或對等的 Azure 產品,以免工作負載突然終止。 訂用帳戶中剩餘的叢集將會停止,並會從主機移除。

在淘汰日期之前,只有基本支援可用。

重要

此功能目前為預覽功能。 Microsoft Azure 預覽版增補使用規定包含適用於 Azure 功能 (搶鮮版 (Beta)、預覽版,或尚未正式發行的版本) 的更多法律條款。 若需此特定預覽版的相關資訊,請參閱 Azure HDInsight on AKS 預覽版資訊。 如有問題或功能建議,請在 AskHDInsight 上提交要求並附上詳細資料,並且在 Azure HDInsight 社群上追蹤我們以獲得更多更新資訊。

不正確的叢集設定可能會導致部署錯誤。 一般而言,當 ARM 範本或 Azure 入口網站的輸入中 (例如 [組態管理] 頁面上) 提供不正確的設定時,就會發生這些錯誤。

範例設定錯誤:

顯示錯誤的螢幕擷取畫面。

下表提供錯誤碼及其描述,以協助診斷和修正常見的錯誤。

設定錯誤

錯誤碼 描述
FlinkClusterValidator#IdentityValidator 檢查任務管理員 (TM) 和作業管理員 (JM) 程序大小是否有後綴 mb。
檢查 TM 和 JM 程序大小是否小於設定的 Pod 記憶體。
FlinkClusterValidator#IdentityValidator 驗證 Pod 身分識別是否已正確設定
FlinkClusterValidator#ClusterSpecValidator 檢查設定的 JM、TM 和歷程記錄伺服器 (HS) Pod CPU 是否在可設定/可配置的 SKU 限制內
檢查設定的 JM、TM 和歷程記錄伺服器 (HS) Pod 記憶體是否在可設定/可配置的 SKU 限制內
FlinkClusterValidator#StorageSpecValidator 儲存體容器驗證的適當名稱
使用支援的儲存體類型進行驗證

系統錯誤

某些錯誤可能會因為環境狀況而發生,而且是暫時性的。 這些錯誤的原因會以 "System" 開頭。 在這種情況下,請嘗試執行下列步驟:

  1. 收集下列資訊:

    • Azure 要求 CorrelationId。 您可以在 [通知] 區域、叢集所在的資源群組底下 (部署頁面上)、或在 az 命令輸出中找到此資訊。

    • DeploymentId。 您可以在 [叢集概觀] 頁面中找到。

    • 詳細的錯誤訊息。

  2. 連絡支援小組以取得這項資訊。

錯誤碼 描述
System.DependencyFailure 其中一個叢集元件失敗。

參考