分享方式:


在 Azure 入口網站中建立 Trino 叢集 (預覽)

注意

AKS 上的 Azure HDInsight 將於 2025 年 1 月 31 日退場。 請於 2025 年 1 月 31 日之前,將工作負載移轉至 Microsoft Fabric 或對等的 Azure 產品,以免工作負載突然終止。 訂用帳戶中剩餘的叢集將會停止,並會從主機移除。

在淘汰日期之前,只有基本支援可用。

重要

此功能目前為預覽功能。 Microsoft Azure 預覽版增補使用規定包含適用於 Azure 功能 (搶鮮版 (Beta)、預覽版,或尚未正式發行的版本) 的更多法律條款。 若需此特定預覽版的相關資訊,請參閱 Azure HDInsight on AKS 預覽版資訊。 如有問題或功能建議,請在 AskHDInsight 上提交要求並附上詳細資料,並且在 Azure HDInsight 社群上追蹤我們以獲得更多更新資訊。

本文說明在 Azure 入口網站中使用 HDInsight on AKS 建立 Trino 叢集的步驟。

必要條件

完成下列各節中的必要條件:

重要

若要在新叢集集區中建立叢集,請在因資源必要條件而建立的使用者指派受控識別上,指派 AKS 代理程式集區 MSI (受控識別操作員) 角色。

AKS 代理程式集區受控識別會在叢集集區建立期間建立。 您可以透過 (您的叢集集集名稱)-代理程式集區來識別 AKS agentpool 受控識別。 請遵循下列步驟來指派角色

建立 Trino 叢集

叢集集區部署完成之後,請繼續使用 Azure 入口網站來建立 Trino 叢集。

  1. 在 Azure 入口網站中,輸入 HDInsight 叢集集區/HDInsight,然後選取 [Azure HDInsight on AKS 叢集集區] 以移至叢集集區頁面。 在 HDInsight on AKS 叢集集區頁面上,選取您要在其中新增 Trino 叢集的叢集集區。

    顯示 Azure 入口網站中的搜尋列的螢幕擷取畫面。

  2. 在特定叢集集區頁面上,按一下 [+ 新增叢集],並提供下列資訊:

    顯示建立 Trino 叢集基本索引標籤的詳細資料的螢幕擷取畫面。

    屬性 描述
    訂用帳戶 此欄位會自動填入已註冊叢集集區的 Azure 訂用帳戶。
    資源群組 此欄位會自動填入,並顯示叢集集區上的資源群組。
    區域 此欄位會自動填入,並顯示叢集集區上選取的區域。
    叢集集區 此欄位會自動填入資料,並顯示現在正在建立叢集的叢集集區名稱。 若要在不同的集區中建立叢集,請在入口網站中尋找該叢集集區,然後按一下 [+ 新增叢集]
    叢集集區版本 此欄位會自動填入資料,並顯示現在正在建立叢集的叢集集區版本。
    HDInsight on AKS 版本 選取新叢集的 HDInsight on AKS 次要或修補版本。 如需詳細資訊,請參閱版本
    叢集類型 從下拉式清單中,選取 Trino 作為叢集型別。
    叢集名稱 輸入新叢集的名稱。
    使用者指派的受控識別 從下拉式清單中,選取要與叢集搭配使用的受控識別。 如果您是受控服務識別 (MSI) 的擁有者,且 MSI 在叢集上沒有受控識別操作員角色,請按一下方塊下方的連結,指派 AKS 代理程式集區 MSI 所需的權限。 如果 MSI 已有正確的權限,則不會顯示任何連結。 請參閱必要條件,了解 MSI 所需的其他角色指派。
    虛擬網路 (VNet) 叢集的虛擬網路。 衍生自叢集集區。
    子網路 叢集的虛擬子網路。 衍生自叢集集區。

    在 [Hive 目錄] 中,提供下列資訊:

    顯示建立 Trino Hive 目錄之基本索引標籤的螢幕擷取畫面。

    屬性 說明
    使用 Hive 目錄 啟用此選項以使用外部 Hive 中繼存放區。
    Hive 目錄名稱 輸入要新增至 Trino 目錄的 Hive 目錄名稱。
    適用於 Hive 的 SQL Database 從下拉式清單中,選取要在其中新增 hive-metastore 資料表的 SQL Database。 如需 SQL Database 的其他需求,請參閱資源必要條件
    SQL 管理員使用者名稱 輸入 SQL 伺服器管理使用者名稱。 中繼存放區會使用此帳戶來與 SQL 資料庫通訊。
    金鑰保存庫 從下拉式清單中,選取 Key Vault,其中包含的祕密具有 SQL 伺服器管理使用者名稱的密碼。 如需 Key Vault 的其他需求,請參閱資源必要條件
    SQL 密碼秘密名稱 從儲存 SQL 資料庫密碼的 Key Vault 輸入祕密名稱。
    Hive 目錄的預設儲存體 從下拉式清單中,選取要用於 Hive 目錄的預設儲存體帳戶。
    容器 選取預設儲存體帳戶中的現有容器來儲存資料和記錄,或建立新的容器。

    注意

    • 目前,我們支援 Azure SQL Database 作為內建的中繼存放區。
    • 由於 Hive 限制,不支援中繼存放區資料庫名稱中使用「-」(連字號) 字元。

    如需詳細資訊,請參閱 Hive 中繼存放區

    在 [儲存查詢事件] 中,提供下列資訊:

    顯示建立 Trino 存放區查詢事件之基本索引標籤的螢幕擷取畫面。

    屬性 說明
    事件的容器 選取預設儲存體帳戶中的容器名稱,以寫入查詢事件。
    容器中的路徑 在容器中提供完整路徑以寫入查詢事件。
    Hive 目錄結構描述 輸入結構描述名稱,以建立資料表和檢視表,以讀取此 Hive 目錄中的查詢事件。
    分割區保留期 (天) 輸入查詢事件分割區的保留期 (以天為單位)。

    如需詳細資訊,請參閱查詢事件記錄

    選取 [下一步:設定] 以繼續。

  3. 在 [設定] 頁面上,提供下列資訊:

    顯示 [建立 Trino 組態] 索引標籤之基本詳細資料的螢幕擷取畫面。

    屬性 說明
    前端節點大小 此值與背景工作角色節點大小相同。
    前端節點數 此值預設為依據叢集型別來設定。
    背景工作角色節點大小 從下拉式清單中,選取建議的 SKU,或按一下 [選取 VM 大小] 以選擇訂用帳戶中可用的 SKU。
    背景工作角色節點的數目 選取叢集需要的背景工作角色節點數目。

    在 [自動調整和 SSH] 中,提供下列資訊:

    顯示自動調整選項的螢幕擷取畫面。

    顯示啟用 BGP 的螢幕擷取畫面。

    屬性 說明
    自動擴充 選取時,您可以選擇排程型自動調整,以設定調整作業的排程。
    啟用 SSH 選取時,您可以選擇所需的 SSH 節點總數,這是使用安全殼層的 Trino CLI 存取點。 允許的 SSH 節點數上限為 5。

    按一下 [下一步:整合] 以繼續。

  4. 在 [整合] 頁面上,提供下列資訊:

    顯示整合選項的螢幕擷取畫面。

    屬性 說明
    Log Analytics 只有在叢集集區具有相關聯的記錄分析工作區時,才能使用此功能,一旦啟用,即可選取要收集的記錄。
    Azure Prometheus 此功能會將計量與記錄傳送到 Azure 監視器工作區,以便直接在叢集中檢視深入解析與記錄。

    按一下 [下一步:標籤] 以繼續。

  5. 在 [標籤] 頁面上,輸入您要指派給叢集的標籤 (選用)。

    顯示標籤選項的螢幕擷取畫面。

    屬性 描述
    Name 輸入名稱 (索引鍵),可協助您依據與組織相關的設定識別資源。 例如,「環境」表示追蹤資源的部署環境。
    輸入有助於與資源建立關聯的值。 例如,「生產」可識別部署到生產環境的資源。
    資源 選取適用的資源類型。

    選取 [下一步: 檢閱 + 建立] 以繼續。

  6. 在 [檢閱 + 建立] 頁面上,尋找頁面頂端的驗證成功訊息,然後按一下 [建立]

    顯示 [叢集檢閱 + 建立] 索引標籤的螢幕擷取畫面。

    建立叢集時會顯示 [部署正在處理中] 頁面。 建立叢集需要 5-10 分鐘的時間。 建立叢集之後,即會顯示「您的部署已完成」 訊息。

    顯示自訂部署完成的螢幕擷取畫面。

    如果您離開頁面,您可以按一下 [通知] 圖示來檢查部署的狀態。

    提示

    如需針對任何部署錯誤進行疑難排解,請參閱此頁面