使用 Azure 入口網站建立具有 Azure Data Lake Storage Gen2 的叢集
Azure 入口網站是 Web 架構的管理工具,可用來管理裝載於 Microsoft Azure 雲端中的服務和資源。 在本文中,您會了解如何使用入口網站來建立 Linux 型 Azure HDInsight 叢集。 如需詳細資訊,請參閱 建立 HDInsight 叢集。
警告
不論使用與否,HDInsight 叢集都是按分鐘計費。 請務必在使用完叢集後將它刪除。 請參閱如何刪除 HDInsight 叢集。
如尚未擁有 Azure 訂用帳戶,請在開始之前先建立免費帳戶。
若要為儲存體建立使用 Data Lake Storage Gen2 的 HDInsight 叢集,請遵循下列步驟來設定具有階層式命名空間的儲存體帳戶。
建立使用者指派的受控識別
建立使用者指派的受控識別 (如果您還沒有的話)。
- 登入 Azure 入口網站。
- 按一下 左上方的 [建立資源]。
- 在搜尋方塊中,輸入使用者指派,然後按一下 [使用者指派的受控識別]。
- 按一下 [建立]。
- 輸入受控識別的名稱,選取正確的訂用帳戶、資源群組和位置。
- 按一下 [建立]。
如需受控身分識別如何在 Azure HDInsight 中運作的詳細資訊,請參閱 Azure HDInsight 中的受控身分識別。
建立儲存體帳戶來與 Data Lake Storage Gen2 搭配使用
建立儲存體帳戶 要搭配 Azure Data Lake Storage Gen2 使用的儲存帳戶。
- 登入 Azure 入口網站。
- 按一下 左上方的 [建立資源]。
- 在搜尋方塊中,輸入儲存體,然後按一下 [儲存體帳戶]。
- 按一下 [建立]。
- 在畫面上
Create storage account
:- 選取正確的訂用帳戶和資源群組。
- 為具有 Data Lake Storage Gen2 的儲存體帳戶輸入名稱。
- 按一下 [進階] 索引標籤。
- 按一下 [Data Lake Storage Gen2] 之下 [階層式命名空間] 旁邊的 [已啟用]。
- 按一下 [檢閱 + 建立] 。
- 按一下 [建立]
如需儲存體帳戶建立期間其他選項的詳細資訊,請參閱快速入門:為 Azure Data Lake Storage Gen2 建立儲存體帳戶。
在 Data Lake Storage Gen2 上設定受控識別的權限
將受控識別指派給儲存體帳戶上的 [儲存體 Blob 資料擁有者] 角色。
在 Azure 入口網站中,移至您的儲存體帳戶。
選取 [存取控制 (IAM)]。
選取 [新增] > [新增角色指派]。
在 [角色] 索引標籤上,選取 [儲存體 Blob 資料擁有者]。
在 [成員] 索引標籤上,選取 [受控識別],然後選取 [選取成員]。
選取您的訂用帳戶,選取 [使用者指派的受控識別],然後選取使用者指派的受控識別。
在 [檢閱 + 指派] 索引標籤上,選取 [檢閱 + 指派] 以指派角色。
您選取的使用者指派身分識別此時會列在所選的角色下方。
如需角色指派的詳細資訊,請參閱使用 Azure 入口網站指派 Azure 角色
完成此初始設定後,您可以透過入口網站建立叢集。 此叢集必須與儲存體帳戶位在相同的 Azure 區域中。 在叢集建立功能表的 [儲存體] 索引標籤中,選取下列選項︰
針對 [主要儲存體類型],請選取 [Azure Data Lake Storage Gen2]。
在 [主要儲存體帳戶] 之下,搜尋並選取新建立的 Data Lake Storage Gen2 儲存體帳戶。
在 [身分識別] 下方,選取新建立的使用者指派受控識別。
注意
- 若要新增 Data Lake Storage Gen2 的次要儲存體帳戶,請在儲存體帳戶層級,只要將先前建立的受控識別指派給您要新增的新 Data Lake Storage Gen2。 請注意,不支援透過 HDInsight 上的 [其他儲存體帳戶] 刀鋒視窗新增具有 Data Lake Storage Gen2 的次要儲存體帳戶。
- 您可以在 HDInsight 使用的 Azure Blob 儲存體帳戶上啟用 RA-GRS 或 RA-ZRS。 不過,不支援為 RA-GRS 或 RA-ZRS 次要端點建立叢集。
- HDInsight 不支援將 Data Lake Storage Gen2 設定為讀取權限異地區域備援儲存體 (RA-GZRS) 或異地區域備援儲存體 (GZRS)。
選取叢集
請參閱使用瀏覽器、PowerShell 或 Azure CLI 刪除 HDInsight 叢集。
疑難排解
如果您在建立 HDInsight 叢集時遇到問題,請參閱存取控制需求。
下一步
您已成功建立 HDInsight 叢集。 現在,請了解如何使用您的叢集。
Apache Spark 叢集
- 使用指令碼動作來自訂 Linux 型 HDInsight 叢集
- 使用 Scala 建立獨立應用程式
- 利用 Apache Livy 在 Apache Spark 叢集上遠端執行作業
- Apache Spark 和 BI:在 HDInsight 中搭配 BI 工具使用 Spark 執行互動式資料分析
- Apache Spark 和機器學習服務:在 HDInsight 中使用 Spark 預測食品檢查結果