Créer un entrepôt SQL

Les administrateurs de l’espace de travail et les utilisateurs suffisamment privilégiés peuvent configurer et gérer des entrepôts SQL. Cet article explique comment créer, modifier et superviser les entrepôts SQL existants.

Vous pouvez également créer des entrepôts SQL à l’aide de l’API d’entrepôt SQL ou de Terraform.

Databricks recommande d’utiliser des entrepôts SQL serverless lorsqu’ils sont disponibles.

Remarque

La plupart des utilisateurs ne peuvent pas créer d’entrepôts SQL, mais peuvent redémarrer n’importe quel entrepôt SQL auquel ils peuvent se connecter. Consultez Qu’est-ce qu’un entrepôt SQL ?.

Spécifications

Les entrepôts SQL ont les exigences suivantes :

  • Pour créer un entrepôt SQL, vous devez être administrateur d’espace de travail ou utilisateur disposant d’autorisations de création de cluster illimitées.

  • Pour les entrepôts SQL classiques ou pro, votre compte Azure doit disposer d’un quota de processeurs virtuels adéquat. Le quota de processeurs virtuels par défaut est généralement suffisant pour créer un entrepôt SQL serverless, mais peut ne pas être suffisant pour mettre à l’échelle l’entrepôt SQL ou créer des entrepôts supplémentaires. Consultez Quota de processeurs virtuels Azure requis pour les entrepôts SQL classiques et pro. Vous pouvez demander un quota de processeurs virtuels supplémentaires. Votre compte Azure peut avoir des limitations sur le quota de processeurs virtuels que vous pouvez demander. Contactez l’équipe en charge votre compte Azure pour plus d’informations.

  • Avant de pouvoir créer un entrepôt SQL serverless dans une région qui prend en charge la fonctionnalité, des étapes peuvent être nécessaires. Consultez Activer des entrepôts SQL serverless.

Créer un entrepôt SQL

Pour créer un entrepôt SQL en utilisant l’interface utilisateur web :

  1. Cliquez sur Entrepôts SQL dans la barre latérale.
  2. Cliquez sur Créer un entrepôt SQL.
  3. Entrez un Nom pour l’entrepôt.
  4. (Facultatif) Configurez les paramètres d’entrepôt. Consultez Configurer les paramètres d’entrepôt SQL.
  5. (Facultatif) Configurez les options avancées. Consultez Options avancées.
  6. Cliquez sur Créer.
  7. (Facultatif) Configurez l’accès à l’entrepôt SQL. Voir Contrôle d’accès aux entrepôts SQL.

Votre entrepôt créé démarre automatiquement.

Default SQL warehouse config

Configurer les paramètres d’entrepôt SQL

Vous pouvez modifier les paramètres suivants lors de la création ou de la modification d’un entrepôt SQL :

  • La taille du cluster représente la taille du nœud de pilote et le nombre de nœuds Worker associés au cluster. La valeur par défaut est X-Large. Pour réduire la latence des requêtes, augmentez la taille.

  • Arrêt automatique détermine si l’entrepôt s’arrête s’il est inactif pendant le nombre de minutes spécifié. Les entrepôts SQL inactifs continuent à accumuler les frais liés aux DBU et à l’instance cloud jusqu’à ce qu’ils soient arrêtés.

    • Entrepôts SQL pro et classiques : La valeur par défaut s’élève à 45 minutes, ce qui est recommandé pour une utilisation classique. La valeur minimale est 10 minutes.
    • Entrepôts SQL serverless : La valeur par défaut s’élève à 10 minutes, ce qui est recommandé pour une utilisation classique. La valeur minimale est 5 minutes quand vous utilisez l’interface utilisateur. Notez que vous pouvez créer un entrepôt SQL serverless à l’aide de l’API Entrepôts SQL. Dans ce cas, vous pouvez réduire la valeur Arrêt automatique jusqu’à une minute.
  • La mise à l’échelle définit le nombre minimal et maximal de clusters qui seront utilisés pour une requête. La valeur par défaut est d’un cluster au minimum et au maximum. Vous pouvez augmenter le nombre maximal de clusters si vous souhaitez gérer davantage d’utilisateurs simultanés pour une requête donnée. Azure Databricks recommande un cluster pour 10 requêtes simultanées.

    Pour maintenir des performances optimales, Databricks recycle régulièrement les clusters. Pendant une période de recyclage, vous pouvez voir temporairement un nombre de clusters qui dépasse le nombre maximal, car Databricks effectue la transition de nouvelles charges de travail vers le nouveau cluster et attend que toutes les charges de travail ouvertes soient terminées avant de recycler l’ancien cluster.

  • Le type détermine le type d’entrepôt. Si serverless est activé dans votre compte, serverless est la valeur par défaut. Consultez Types d’entrepôts SQL pour avoir la liste.

options avancées

Configurez les options avancées suivantes en développant la zone Options avancées quand vous créez un entrepôt SQL ou modifiez un entrepôt SQL existant. Vous pouvez aussi configurer ces options en utilisant l’API d’entrepôt SQL.

  • Étiquettes : les étiquettes vous permettent de superviser le coût des ressources cloud utilisées par les utilisateurs et les groupes de votre organisation. Vous spécifiez les étiquettes sous forme de paires clé-valeur.

  • Unity Catalog : Si Unity Catalog est activé pour l’espace de travail, il s’agit de la valeur par défaut de tous les nouveaux entrepôts dans l’espace de travail. Si Unity Catalog n’est pas activé pour votre espace de travail, vous ne voyez pas cette option. Pour plus d’informations sur Unity Catalog, consultez Unity Catalog.

  • Canal : utilisez le canal de préversions pour tester une nouvelle fonctionnalité, y compris vos requêtes et tableaux de bord, avant qu’elle ne devienne la norme Databricks SQL.

    Les notes de publication énumèrent le contenu de la dernière préversion.

Important

Databricks recommande d’utiliser une version préliminaire pour les charges de travail de production. Comme seuls les administrateurs d’espace de travail peuvent voir les propriétés d’un entrepôt, notamment son canal, pensez à indiquer dans le nom de l’entrepôt SQL Databricks qu’il utilise une préversion, afin que les utilisateurs ne l’utilisent pas pour des charges de travail de production.

Gérer un entrepôt SQL

Les administrateurs d’espace de travail et les utilisateurs avec les privilèges PEUT GÉRER sur un entrepôt SQL peuvent effectuer les tâches suivantes sur un entrepôt SQL existant :

  • Pour arrêter un entrepôt en cours d’exécution, cliquez sur l’icône d’arrêt en regard de l’entrepôt.

  • Pour démarrer un entrepôt arrêté, cliquez sur l’icône de démarrage en regard de l’entrepôt.

  • Pour modifier un entrepôt, cliquez sur le menu kebab Vertical Ellipsis, puis sur Modifier.

  • Pour ajouter ou modifier des autorisations, cliquez sur le menu kebab Vertical Ellipsis, puis sur Autorisations. Pour en savoir plus sur les niveaux d’autorisation, consultez Contrôle d’accès aux entrepôts SQL.

  • Pour mettre à niveau un entrepôt SQL vers serverless, cliquez sur le menu des points de suspension Vertical Ellipsis, puis cliquez sur Mettre à niveau vers serverless.

  • Pour supprimer un entrepôt, cliquez sur le menu kebab Vertical Ellipsis, puis sur Supprimer.

Remarque

Contactez votre représentant Databricks pour restaurer un entrepôt supprimé dans les 14 jours.