この記事は、ワークスペースの作成と管理のオプションの概要です。
ワークスペースとは?
ワークスペースは、クラウド サービス アカウントでの Azure Databricks デプロイです。 指定した一連のユーザーに対して Azure Databricks 資産を操作するための統合環境が提供されます。
使用できる Databricks ワークスペースには、次の 2 種類があります。
- サーバーレス ワークスペース: Azure Databricks アカウントでのワークスペースのデプロイ。完全なサーバーレス エクスペリエンスを提供するために、サーバーレス コンピューティングと既定のストレージが事前に構成されています。 サーバーレス ワークスペースからクラウド ストレージに接続することはできます。
- ハイブリッド ワークスペース: クラシック ワークスペースとも呼ばれるこのワークスペースのデプロイでは、既存の Azure アカウント内のストレージとコンピューティング リソースがプロビジョニングされます。 サーバーレス コンピューティングは、ハイブリッド ワークスペースで引き続き使用できます。
要求事項
Azure Databricks ワークスペースを作成する前に、無料試用版サブスクリプションではない Azure サブスクリプションが必要です。
無料アカウントをお持ちの場合は、次の手順を実行します。
- プロファイルに移動し、サブスクリプションを 従量課金制に変更します。 Azure 無料アカウントを参照してください。
- 使用制限を削除します。
- リージョン内の vCPU のクォータの引き上げを要求します。
必要な Azure のアクセス許可
Azure Databricks ワークスペースを作成するには、次のいずれかが必要です。
- サブスクリプション レベルで Azure 共同作成者 または 所有者 ロールを持つユーザー。
- 次のアクセス許可の一覧を持つカスタム ロール定義を持つユーザー。
Microsoft.Databricks/workspaces/*Microsoft.Resources/subscriptions/resourceGroups/readMicrosoft.Resources/subscriptions/resourceGroups/writeMicrosoft.Databricks/accessConnectors/*Microsoft.Compute/register/actionMicrosoft.ManagedIdentity/register/actionMicrosoft.Storage/register/actionMicrosoft.Network/register/actionMicrosoft.Resources/deployments/validate/actionMicrosoft.Resources/deployments/writeMicrosoft.Resources/deployments/read
注
これらのプロバイダーがサブスクリプションに既に登録されている場合、Microsoft.Compute/register/action、Microsoft.ManagedIdentity/register/action、Microsoft.Storage/register/action、 Microsoft.Network/register/action のアクセス許可は必要ありません。
「リソース プロバイダーの登録」を参照してください。
ワークスペースの種類の選択
次のセクションでは、一般的なユース ケースに最適なワークスペースの種類について説明します。 これらの推奨事項は、サーバーレスワークスペースとクラシック ワークスペースのどちらをデプロイするかを決定するのに役立ちます。
サーバーレス ワークスペースを選択するタイミング
サーバーレス ワークスペースは、ほとんどのユース ケースに最適な選択肢であり、Lakebase、Genie、Databricks Apps などの運用とコンシューマーのユース ケースを開始する最も簡単な方法です。
サーバーレス ワークスペースは、次のユース ケースに最適な選択肢です。
- ビジネス ユーザーが Databricks One にアクセスできるようにする
- AI/BI ダッシュボードの作成
- Databricks アプリの作成
- ノートブックまたは SQL ウェアハウスを使用した探索的分析の実行
- Lakehouse フェデレーションを介した SaaS プロバイダーへの接続 (ただし、Lakeflow Connect ではない)
- ビジネス ユース ケースに Genie Spaces を使用する
- ベクター検索、モデル サービス、AI 関数、Agent Bricks などの AI 機能の使用
- サーバーレス Lakeflow Spark 宣言パイプラインの作成
クラシック ワークスペースを選択するタイミング
クラシック ワークスペースは、次のユース ケースに最適な選択肢です。
- Spark RDD を使用する既存のレガシ Spark コードの移植
- Scala または R を主要なコーディング言語として使用する
- 時間ベースのトリガー間隔を必要とするストリーミング データ
- Lakeflow Connect を使用したオンプレミス システムまたはプライベート データベースへの直接接続
ワークスペースの作成オプション
Azure Databricks ワークスペースをデプロイする方法は複数あります。 標準的なデプロイ方法は、Azure Portal または Terraform を使用します。
さらに、次のツールを使用してワークスペースを作成できます。