建立叢集集區和叢集
重要
此功能目前為預覽功能。 適用於 Microsoft Azure 預覽版的補充使用規定包含適用於 Beta 版、預覽版或尚未發行至正式運作之 Azure 功能的更合法條款。 如需此特定預覽的相關信息,請參閱 AKS 預覽資訊的 Azure HDInsight。 如需問題或功能建議,請在 AskHDInsight 上提交要求,並提供詳細數據,並遵循我們在 Azure HDInsight 社群上取得更多更新。
AKS 上的 HDInsight 具有叢集集區和叢集的概念。
叢集集區 是叢集的邏輯群組,並維護相同集區中的一組叢集,有助於跨多個叢集類型建立健全的互操作性。 它可以在現有的虛擬網路或虛擬網路外部建立。
AKS 上 HDInsight 中的叢集集區會對應至 AKS 基礎結構中的一個叢集。
叢集是個別的 計算工作負載,例如 Apache Spark、Apache Flink 或 Trino,可在相同的叢集集區中建立。
若要建立 Apache Spark、Apache Flink 或 Trino 叢集,您必須先建立叢集集區。
必要條件
建立叢集集區之前,請確定您已完成訂用 帳戶必要條件 和資源 必要條件 。
建立叢集集區
登入 Azure 入口網站。
在 Azure 入口網站 搜尋列中,輸入“AKS 叢集集區上的 HDInsight”,然後從下拉式清單中選取 [AKS 叢集集區上的 Azure HDInsight]。
按一下 [+ 建立]。
在 [基本] 索引標籤中,輸入下列資訊:
屬性 描述 訂用帳戶 從下拉式清單中,選取您想要在 AKS 叢集集區上建立 HDInsight 的 Azure 訂用帳戶。 資源群組 從下拉式清單中,選取現有的資源群組,或選取 [ 新建]。 集區名稱 輸入要建立的叢集集區名稱。 叢集集區名稱長度不能超過 26 個字元。 它必須以字母開頭、以英數位元結尾,而且只能包含英數位元和連字元。 區域 從下拉式清單中,選取叢集集區的區域。 檢查 區域可用性。 對於虛擬網路中的叢集集區,虛擬網路和叢集集區的區域必須相同。 叢集集區版本 從下拉式清單中,選取 AKS 叢集集區版本的 HDInsight。 虛擬機器 從下拉式清單中,根據您的需求選取叢集集區的虛擬機大小。 受控資源群組 (選擇性)提供受控資源群組的名稱。 它會保存 HDInsight 在 AKS 上建立的輔助資源。 選取 [ 下一步:安全性 + 網络] 以繼續。
在 [ 安全性 + 網络功能 ] 頁面上,提供下列資訊:
屬性 說明 虛擬網路 (VNet) 從下拉式清單中,選取與叢集集區位於相同區域中的虛擬網路。 子網路 從下拉式清單中,選取您計劃與叢集集區建立關聯的子網名稱。 選取 [ 下一步:整合 ] 以繼續。
在 [ 整合] 頁面上,提供下列資訊:
屬性 說明 Log Analytics (選擇性)選取此選項可讓Log Analytics藉由將計量和記錄傳送至Log Analytics工作區,直接檢視叢集中的深入解析和記錄。 Azure Prometheus 完成叢集集區建立之後,您可以啟用此選項。 選取 [ 下一步:卷標 ] 以繼續。
在 [ 標記 ] 頁面上,輸入您想要指派給叢集集區的任何標記(選擇性)。
屬性 描述 Name 輸入名稱(金鑰),以協助您根據與組織相關的設定來識別資源。 例如,「環境」可追蹤您資源的部署環境。 值 輸入有助於與資源建立關聯的值。 例如,「生產」可識別部署到生產環境的資源。 資源 選取適用的資源類型。 選取 [下一步: 檢閱 + 建立] 以繼續。
在 [ 檢閱 + 建立] 頁面上,尋找 頁面頂端的 [驗證成功 ] 訊息,然後按兩下 [ 建立]。
正在建立叢集集區時會顯示 [ 部署正在進行中 ] 頁面,而且 在叢集集區完全部署且可供使用后,就會顯示 [部署已完成] 頁面 。
如果您離開頁面,您可以按下 [通知] 圖示來檢查部署的狀態。
叢集集區部署完成之後,請繼續使用 Azure 入口網站 來建立 Trino、Flink 和 Spark 叢集。
建立叢集
有三種方式可從 Azure 入口網站在 AKS 叢集上建立 Azure HDInsight:
- 從市集搜尋並建立「AKS 叢集上的 Azure HDInsight」。
- 在 Azure 入口網站 中搜尋並選取 [AKS 叢集上的 Azure HDInsight] 以從列出 AKS 叢集上所有 HDInsight 的頁面建立叢集。
- 選取現有叢集集區 [概觀] 頁面中的 [新增] 來建立叢集。 在此選項中,您有兩種方式可以建立叢集。
藉由提供不使用進階設定的輸入數目下限來建立叢集。 此選項會以智慧型手機預設值預先填入必要設定欄位,並自動建立必要資源。
虛擬機器 SKU 大小會預先填入成本最低的建議 SKU。 如果沒有任何建議的 SKU,就會在叢集建立時預先填入具有最低虛擬核心和可用配額上限的 SKU。 叢集會以五個節點的預設常數建立。 Flink 和 Trino 叢集會有兩個前端節點,而 Spark 叢集會有三個前端節點。
使用者指派的受控識別和記憶體帳戶將會在受控資源群組中自動建立。 您可以檢閱叢集的組態,這會在 [檢閱+建立] 索引標籤上建立。按兩下 [建立] 之後,就會在建立叢集時顯示 [部署正在進行中] 頁面。 一旦叢集完全部署且可供使用,就會顯示「您的部署已完成」的訊息。
如果您想要有更多的彈性來自定義叢集組態,請將 [使用進階組態] 切換為 [開啟]。
重要
若要在新叢集集區中建立叢集,請在資源必要條件中建立的使用者指派受控識別上,指派 AKS 代理程式集區 MSI「受控識別操作員」角色。 當使用者有指派 Azure RBAC 角色的許可權時,會自動指派該角色。
AKS 代理程式集區受控識別會在叢集集區建立期間建立。 您可以透過 [叢集集集名稱] -agentpool 來識別 AKS 代理程式集區受控識別。 請遵循下列步驟來 指派角色。
如需快速入門,請參閱下列步驟。
叢集集區建立完成時,按兩下 [部署完成] 頁面或 [通知] 區域的 [移至資源]。 如果無法使用 [移至資源] 選項,請在 Azure 入口網站 的搜尋列中輸入 AKS 叢集集區上的 HDInsight,然後選取您建立的叢集集區。
按兩下 [+ 新增叢集 ],然後提供下列資訊:
屬性 描述 訂用帳戶 根據預設,它會填入用於叢集集區的訂用帳戶。 資源群組 根據預設,它會填入用於叢集集區的資源群組。 叢集集區 表示必須在其中建立叢集的叢集集區。 若要在不同的集區中建立叢集,請在入口網站中尋找該叢集集區,然後按兩下 [ + 新增叢集]。 區域 根據預設,它會填入叢集集區所使用的區域。 叢集集區版本 根據預設,它會填入叢集集區所使用的版本。 HDInsight on AKS 版本 從下拉式清單中,選取 AKS 版本上的 HDInsight。 如需詳細資訊,請參閱 版本控制。 叢集類型 從下拉式清單中,選取您想要建立的叢集類型:Trino、Flink 或 Spark。 叢集封裝 選取具有所選叢集類型可用元件版本的叢集套件。 叢集名稱 輸入新叢集的名稱。 使用者指派的受控識別 選取要與叢集搭配使用的受控識別。 儲存體 帳戶 (ADLS Gen2) 選取記憶體帳戶和容器,這是叢集記錄和其他輸出的預設位置。 這是 Apache Flink 和 Spark 叢集類型的必要專案。 虛擬網路 (VNet) 叢集的虛擬網路。 其衍生自叢集集區。 子網路 叢集的虛擬網路子網。 其衍生自叢集集區。 按 [下一步:設定 ] 以繼續。
在 [ 組態 ] 頁面上,提供下列資訊:
屬性 說明 前端節點大小 此值與背景工作節點大小相同。 前端節點數目 此值預設會根據叢集類型來設定。 背景工作角色節點大小 從下拉式清單中,選取建議的 SKU,或按兩下 [ 選取 VM 大小] 來選擇訂用帳戶中可用的 SKU。 背景工作角色節點的數目 選取叢集所需的背景工作節點數目。 Autoscale (選擇性)選取此選項以啟用自動調整功能 安全殼層 (SSH) 設定 (選擇性)選取此選項以啟用 SSH 節點。 藉由啟用 SSH,會建立更多 VM 節點。 注意
您會看到額外的區段,以提供 Apache Flink 叢集的服務組態。
按 [下一步:整合 ] 繼續。
在 [ 整合] 頁面上,提供下列資訊:
屬性 說明 Log Analytics (選擇性)選取此選項可讓Log Analytics藉由將計量和記錄傳送至Log Analytics工作區,直接檢視叢集中的深入解析和記錄。 Azure Prometheus (選擇性)選取此選項以啟用 Azure 受控 Prometheus,藉由將計量和記錄傳送至 Azure 監視器工作區,直接檢視叢集中的深入解析和記錄。 注意
若要啟用Log Analytics和 Azure Prometheus,應該先在叢集集區層級啟用它。
按 [下一步:標籤 ] 以繼續。
在 [ 卷標 ] 頁面上,輸入您想要指派給叢集的任何標籤(選擇性)。
屬性 描述 Name 輸入名稱(金鑰),以協助您根據與組織相關的設定來識別資源。 「環境」可追蹤您資源的部署環境。 值 輸入有助於與資源建立關聯的值。 「生產」,用來識別部署到生產環境的資源。 資源 選取適用的資源類型。 選取 [下一步: 檢閱 + 建立] 以繼續。
在 [ 檢閱 + 建立] 頁面上,尋找 頁面頂端的 [驗證成功 ] 訊息,然後按兩下 [ 建立]。
正在建立叢集時會顯示 [ 部署正在進行中 ] 頁面,且 叢集完全部署且可供使用后,就會顯示 [部署 已完成] 頁面。
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應