この記事は、ワークスペースの作成と管理のオプションの概要です。
ワークスペースとは?
ワークスペースは、クラウド サービス アカウントでの Azure Databricks デプロイです。 指定した一連のユーザーに対して Azure Databricks 資産を操作するための統合環境が提供されます。
使用できる Databricks ワークスペースには、次の 2 種類があります。
- サーバーレス ワークスペース (パブリック プレビュー):Databricks アカウントでのワークスペースのデプロイ。完全なサーバーレス エクスペリエンスを提供するために、サーバーレス コンピューティングと既定のストレージが事前に構成されています。 サーバーレス ワークスペースからクラウド ストレージに接続することはできます。
- クラシック ワークスペース: 既存のクラウド アカウントにストレージ リソースとコンピューティング リソースをプロビジョニングする Databricks アカウント内のワークスペースデプロイ。 サーバーレス コンピューティングは、クラシック ワークスペースで引き続き使用できます。
要求事項
Azure Databricks ワークスペースを作成する前に、無料試用版サブスクリプションではない Azure サブスクリプションが必要です。
無料アカウントをお持ちの場合は、次の手順を実行します。
- プロファイルに移動し、サブスクリプションを 従量課金制に変更します。 Azure 無料アカウントを参照してください。
- 使用制限を削除します。
- リージョン内の vCPU のクォータの引き上げを要求します。
必要な Azure のアクセス許可
Azure Databricks ワークスペースを作成するには、次のいずれかが必要です。
サブスクリプション レベルで Azure 共同作成者 または 所有者 ロールを持つユーザー。
次のアクセス許可の一覧を持つカスタム ロール定義を持つユーザー。
Microsoft.Databricks/workspaces/*Microsoft.Resources/subscriptions/resourceGroups/readMicrosoft.Resources/subscriptions/resourceGroups/writeMicrosoft.Databricks/accessConnectors/*Microsoft.Compute/register/actionMicrosoft.ManagedIdentity/register/actionMicrosoft.Storage/register/actionMicrosoft.Network/register/actionMicrosoft.Resources/deployments/validate/actionMicrosoft.Resources/deployments/writeMicrosoft.Resources/deployments/read
注
これらのプロバイダーがサブスクリプションに既に登録されている場合、Microsoft.Compute/register/action、Microsoft.ManagedIdentity/register/action、Microsoft.Storage/register/action、 Microsoft.Network/register/action のアクセス許可は必要ありません。
「リソース プロバイダーの登録」を参照してください。
ワークスペースの種類の選択
次のセクションでは、一般的なユース ケースに最適なワークスペースの種類について説明します。 これらの推奨事項は、サーバーレス ワークスペースとクラシック ワークスペースのどちらをデプロイするかを決定するのに役立ちます。
サーバーレス ワークスペースを選択するタイミング
サーバーレス ワークスペースは、次のユース ケースに最適な選択肢です。
- ビジネス ユーザーが Databricks One にアクセスできるようにする
- AI/BI ダッシュボードを作成する
- Databricks アプリを作成する
- ノートブックまたは SQL ウェアハウスを使用して探索的分析を実行する
- Lakehouse フェデレーション経由で SaaS プロバイダーに接続する (ただし、Lakeflow Connect には接続しない)
- ビジネス ユース ケースに Genie Spaces を使用する
- 運用環境に移行する前に、新しいモザイク AI 機能をテストする
- サーバーレスの Lakeflow Spark 宣言パイプラインを作成する
クラシック ワークスペースを選択するタイミング
クラシック ワークスペースは、次のユース ケースに最適な選択肢です。
- GPU を必要とする AI または ML 開発作業を行う
- Machine Learning または Apache Spark MLib に Databricks ランタイムを使用する
- Spark RDD を使用する既存のレガシ Spark コードへの移植
- Scala または R を主要なコーディング言語として使用する
- 既定または時間ベースのトリガー間隔を必要とするデータをストリーム配信する
- PrivateLink 接続経由で Databricks API に接続する
- Lakeflow Connect を使用してオンプレミス のシステムまたはプライベート データベースに直接接続する
ワークスペースの作成オプション
Azure Databricks ワークスペースをデプロイする方法は複数あります。 標準的なデプロイ方法は、Azure Portal または Terraform を使用します。
さらに、次のツールを使用してワークスペースを作成できます。