本文是建立和管理工作區的選項概觀。
什麼是工作區?
工作區是雲端服務帳戶中的 Azure Databricks 部署。 它提供統一的環境,以便針對一組指定的使用者使用 Azure Databricks 資產。
Databricks 工作區有兩種類型:
- Serverless workspaces(公開預覽版):在你的 Databricks 帳號中部署工作空間,預先設定無伺服器運算與預設儲存,提供完全無伺服器的體驗。 你仍然可以從無伺服器的工作空間連接到你的雲端儲存。
- 經典工作區:在你的 Databricks 帳號中部署工作區,負責在現有雲端帳號中配置儲存與運算資源。 無伺服器運算仍可在經典工作空間中使用。
需求
在建立 Azure Databricks 工作空間之前,你必須擁有非免費試用版的Azure 訂閱。
如果你有免費帳號,請完成以下步驟:
- 進入您的個人資料,並將訂閱變更為隨用隨付。 請參閱 Azure 免費帳戶。
- 拿掉消費限制。
- 在您的區域中要求增加 vCPU 的配額 。
必需的 Azure 權限
若要建立 Azure Databricks 工作區,您必須是下列其中一項:
在訂用帳戶層級具有 Azure 協作者 或 擁有者 角色的使用者。
具有下列權限清單之自訂角色定義的使用者:
Microsoft.Databricks/workspaces/*Microsoft.Resources/subscriptions/resourceGroups/readMicrosoft.Resources/subscriptions/resourceGroups/writeMicrosoft.Databricks/accessConnectors/*Microsoft.Compute/register/actionMicrosoft.ManagedIdentity/register/actionMicrosoft.Storage/register/actionMicrosoft.Network/register/actionMicrosoft.Resources/deployments/validate/actionMicrosoft.Resources/deployments/writeMicrosoft.Resources/deployments/read
備註
如果這些提供者已在訂用帳戶中註冊,則不需要Microsoft.Compute/register/action、Microsoft.ManagedIdentity/register/action、Microsoft.Storage/register/action、 Microsoft.Network/register/action許可權。 詳見 註冊資源提供者。
選擇工作區類型
以下章節說明哪種工作區類型最適合常見使用情境。 利用這些建議幫助你決定是部署無伺服器工作空間還是經典工作空間。
何時選擇無伺服器工作空間
無伺服器工作空間是以下應用情境的最佳選擇:
- 讓商業用戶能夠存取 Databricks One
- 建立 AI/BI 儀表板
- 建立 Databricks 應用程式
- 使用筆記型電腦或 SQL 倉庫進行探索性分析
- 透過 Lakehouse Federation 連接 SaaS 供應商(但不包括 Lakeflow Connect)
- 使用 Genie Spaces 進行商業應用
- 在將 Mosaic AI 新功能投入生產前先測試
- 建立無伺服器的 Lakeflow Spark 宣告式管線
何時選擇經典工作區
經典工作區是以下使用情境的最佳選擇:
- 做需要 GPU 的 AI 或機器學習開發工作
- 使用 Databricks 執行環境進行機器學習或 Apache Spark MLib
- 移植使用Spark RDD的現有舊有Spark程式碼
- 使用 Scala 或 R 作為主要的程式語言
- 需要預設或基於時間的觸發間隔的串流資料
- 透過 PrivateLink 連線連接 Databricks API
- 可直接透過 Lakeflow Connect 連接本地系統或私人資料庫
工作區建立選項
有多種方式可以部署 Azure Databricks 工作區。 標準部署方法是透過 Azure 入口網站或 Terraform。
此外,您可以使用下列工具來建立工作區: