Remarque
L’accès à cette page requiert une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page requiert une autorisation. Vous pouvez essayer de modifier des répertoires.
Cet article présente les options de création et de gestion des espaces de travail.
Qu’est-ce qu’un espace de travail ?
Un espace de travail est un déploiement Azure Databricks dans un compte de service cloud. Il fournit un environnement unifié pour l’utilisation des ressources Azure Databricks pour un ensemble d’utilisateurs spécifié.
Il existe deux types d’espaces de travail Databricks disponibles :
- Espaces de travail sans serveur : un déploiement d’espace de travail dans votre compte Azure Databricks, préconfiguré avec une puissance de calcul sans serveur et un stockage par défaut pour offrir une expérience entièrement sans serveur. Vous pouvez toujours vous connecter à votre stockage cloud à partir d’espaces de travail serverless.
- Espaces de travail hybrides : également appelé espace de travail classique, ce déploiement d’espace de travail provisionne le stockage et les ressources de calcul dans votre compte Azure existant. Le calcul serverless est toujours disponible dans les espaces de travail hybrides.
Spécifications
Avant de créer un espace de travail Azure Databricks, vous devez disposer d’un abonnement Azure qui n’est pas un abonnement d’essai gratuit.
Si vous disposez d’un compte gratuit, procédez comme suit :
- Accédez à votre profil et remplacez votre abonnement par paiement à l’utilisation. Consultez le compte gratuit Azure.
- Supprimez la limite de dépense.
- Demandez une augmentation de quota pour les processeurs virtuels dans votre région.
Autorisations Azure requises
Pour créer un espace de travail Azure Databricks, vous devez être l’un des éléments suivants :
- Un utilisateur disposant du rôle Contributeur ou Propriétaire Azure au niveau de l’abonnement.
- Un utilisateur disposant d’une définition de rôle personnalisée qui a la liste d’autorisations suivante :
Microsoft.Databricks/workspaces/*Microsoft.Resources/subscriptions/resourceGroups/readMicrosoft.Resources/subscriptions/resourceGroups/writeMicrosoft.Databricks/accessConnectors/*Microsoft.Compute/register/actionMicrosoft.ManagedIdentity/register/actionMicrosoft.Storage/register/actionMicrosoft.Network/register/actionMicrosoft.Resources/deployments/validate/actionMicrosoft.Resources/deployments/writeMicrosoft.Resources/deployments/read
Note
Les autorisations Microsoft.Compute/register/action, Microsoft.ManagedIdentity/register/action, Microsoft.Storage/register/action, Microsoft.Network/register/action ne sont pas requises si ces fournisseurs sont déjà inscrits dans l’abonnement. Voir Inscrire le fournisseur de ressources.
Choix d’un type d’espace de travail
Les sections suivantes décrivent le type d’espace de travail le mieux adapté aux cas d’usage courants. Utilisez ces recommandations pour vous aider à décider s’il faut déployer un espace de travail serverless ou classique.
Quand choisir des espaces de travail serverless
Les espaces de travail serverless sont le meilleur choix pour la plupart des cas d’usage et le moyen le plus simple de commencer à utiliser des cas d’usage opérationnels et consommateurs, tels que Lakebase, Genie et Databricks Apps.
Les espaces de travail serverless sont le meilleur choix pour les cas d’usage suivants :
- Permettre aux utilisateurs professionnels d’accéder à Databricks One
- Création de tableaux de bord IA/BI
- Création d’applications Databricks
- Exécution d’analyses exploratoires à l’aide de notebooks ou d’entrepôts SQL
- Connexion à des fournisseurs SaaS via Lakehouse Federation (mais pas Lakeflow Connect)
- Utilisation de Genie Spaces pour les cas d’usage métier
- Utilisation de fonctionnalités IA telles que la recherche vectorielle, le service de modèle, les fonctions IA et les briques de l’agent
- Création de pipelines déclaratifs Lakeflow Spark sans serveur
Quand choisir des espaces de travail classiques
Les espaces de travail classiques sont le meilleur choix pour les cas d’usage suivants :
- Portage du code Spark hérité existant qui utilise des RDD Spark
- Utilisation de Scala ou R comme langage de codage principal
- Diffusion en continu de données nécessitant des intervalles de déclencheurs basés sur le temps
- Connexion directe à des systèmes locaux ou à des bases de données privées via Lakeflow Connect
Options de création d’un espace de travail
Il existe plusieurs façons de déployer un espace de travail Azure Databricks. La méthode de déploiement standard est via le portail Azure ou Terraform.
- Déployer un espace de travail à l’aide du portail Azure
- Déployer un espace de travail à l’aide de Terraform
En outre, vous pouvez créer des espaces de travail à l’aide des outils suivants :