開始使用 Azure Databricks

已完成

Azure Databricks 是雲端式數據分析平臺,可為數據工程、機器學習和分析提供統一的環境。 Azure Databricks 是與 Databricks 共同設計的,其領導階層建立了 Apache Spark。 Azure Databricks 提供快速、簡單且共同作業的 Apache Spark 分析服務。 此平臺會與 Azure 的其他服務深入整合,為具有增強安全性、效能和延展性的使用者提供順暢的體驗。 它可讓數據驅動的工作,例如數據準備、機器學習和數據科學工作流程,使其成為一個多功能的工具,可供想要利用巨量數據的強大功能的組織使用。

Azure Databricks 的主要功能包括其原生整合Microsoft Entra ID,以及其使用其他 Azure 服務的功能,例如 Azure 儲存體、Azure Data Lake Storage 和 Azure Cosmos DB。 此平臺也提供互動式工作區,可促進數據科學家、數據工程師和商務分析師之間的共同作業。 此共同作業 環境支援 Python、Scala、R 和 SQL 等各種程式設計語言,讓小組能夠有效率地開發和反覆運算其數據模型。 此外,Azure Databricks 的設計目的是要輕鬆調整規模,同時管理機器學習演算法的計算需求,以及大型數據集的處理需求。

建立 Azure Databricks 工作區

若要使用 Azure Databricks,您必須在 Azure 訂閱中建立 Azure Databricks「工作區」。 您可以透過下列方法來完成這項作業:

  • 使用 Azure 入口網站 用戶介面
  • 使用 Azure Resource Manager (ARM) 或 Bicep 範本
  • 使用 New-AzDatabricksWorkspace Azure PowerShell Cmdlet
  • 使用 az databricks workspace create Azure 命令行介面 (CLI) 命令

當您建立工作區時,您必須指定下列其中一個定價層。

  • 標準 - 具有 Microsoft Entra ID 整合的核心 Apache Spark 功能。
  • 進階 - 角色型存取控制及其他企業級功能。
  • 試用 - 進階層工作區的 14 天免費試用

Azure Databricks

使用 Azure Databricks 入口網站

布建 Azure Databricks 工作區之後,您可以使用 Azure Databricks 入口網站來處理數據和計算資源。 Azure Databricks 入口網站是以 Web 為基礎的使用者介面,您可以在其中建立和管理工作區資源,例如 Spark 叢集,並使用筆記本和查詢來處理檔案和數據表中的數據。

Azure Databricks 入口網站