Partager via


Types d’entrepôt SQL

Databricks SQL prend en charge les types serverless, pro et classic. Cet article décrit les fonctionnalités disponibles pour chaque type et compare les performances et les fonctionnalités.

Fonctionnalités de performances par type

Chaque type d’entrepôt SQL a des fonctionnalités de performances différentes. Le tableau suivant présente les fonctionnalités de performances prises en charge par chaque type d’entrepôt SQL.

Type d’entrepôt Moteur photon E/S prédictives Gestion intelligente des charges de travail
Sans serveur X X X
Avantage X X
Classique X

La liste suivante décrit chaque fonctionnalité de performances :

  • Photon : Moteur de requête vectorisé intégré sur Databricks. Il rend vos appels d’API SQL et DataFrame existants plus rapides et réduit votre coût total par charge de travail.

  • Predictive IO : une suite de fonctionnalités permettant d’accélérer les opérations d’analyse sélectives dans les requêtes SQL. Les E/S prédictives peuvent fournir un large éventail de vitesses.

  • Gestion intelligente des charges de travail (IWM) : ensemble de fonctionnalités qui améliorent la capacité de Databricks SQL Serverless à traiter un grand nombre de requêtes rapidement et rentables. À l’aide de techniques de prédiction et de gestion dynamique optimisées par l’IA, IWM fonctionne pour vérifier que les charges de travail disposent rapidement de la bonne quantité de ressources. La principale différence réside dans les fonctionnalités d’IA de Databricks SQL pour répondre dynamiquement aux demandes de charge de travail plutôt que d’utiliser des seuils statiques.

    Remarque

    Pour connaître la tarification de chaque type d’entrepôt et une comparaison détaillée des fonctionnalités, consultez Databricks SQL. Pour en savoir plus sur les dernières fonctionnalités Databricks SQL, consultez les notes de publication de Databricks SQL.

Différences de performances entre les types d’entrepôt SQL

Chaque type d’entrepôt SQL a des caractéristiques de performances différentes.

Entrepôts SQL serverless

À l’aide de l’architecture serverless Azure Databricks, un entrepôt SQL serverless prend en charge toutes les fonctionnalités de performances de Databricks SQL. Avec un entrepôt SQL serverless et ses fonctionnalités de performances, vous obtenez :

  • Temps de démarrage rapide (généralement entre 2 et 6 secondes).
  • Mise à l’échelle rapide pour acquérir davantage de calcul si nécessaire pour maintenir une faible latence.
  • L’admission des requêtes est plus proche de la limitation du matériel que la machine virtuelle.
  • Mise à l’échelle rapide pour réduire les coûts lorsque la demande est faible, offrant des performances cohérentes avec des coûts et des ressources optimisés.

Choisissez un entrepôt SQL serverless pour obtenir les meilleures performances de démarrage, les E/S les plus efficaces, la gestion plus intelligente de la demande de requête qui varie considérablement au fil du temps et une mise à l’échelle automatique rapide lorsque la mise en file d’attente des requêtes se produit. Consultez Gestion intelligente des charges de travail et mise à l’échelle automatique.

Un entrepôt SQL serverless fonctionne bien avec ces types de charges de travail :

  • ETL
  • Informatique décisionnelle
  • Analyse exploratoire

Important

Les entrepôts SQL ne prennent pas en charge la transmission des informations d’identification. Databricks recommande d’utiliser Unity Catalog pour la gouvernance des données. Consultez Qu’est-ce que Unity Catalog ?.

Entrepôts Pro SQL

Un entrepôt pro SQL prend en charge Photon et les E/S prédictives, mais ne prend pas en charge la Gestion Intelligente des Charges de Travail. Avec un entrepôt SQL pro (contrairement à un entrepôt SQL serverless), la couche de calcul existe dans votre compte d’abonnement Azure plutôt que dans votre compte Azure Databricks. Sans une gestion intelligente des charges de travail, les entrepôts sont moins réactifs à une demande de requêtes qui varie considérablement avec le temps et ne peuvent pas ajuster leur échelle aussi rapidement qu'un entrepôt SQL sans serveur. Un entrepôt SQL pro prend plusieurs minutes pour démarrer (généralement environ 4 minutes) et ajuste sa capacité à la hausse et à la baisse avec moins de rapidité de réponse qu'un entrepôt SQL sans serveur. Consultez la logique de mise en file d'attente et de mise à l’échelle automatique.

Utilisez un entrepôt PRO SQL quand :

  • Les bases de données SQL serverless ne sont pas disponibles dans une région spécifique.
  • Vous disposez d’une mise en réseau personnalisée et souhaitez vous connecter à des bases de données dans votre réseau dans le cloud ou localement pour la fédération ou une architecture de type hybride. Par exemple, utilisez un entrepôt SQL professionnel si vous souhaitez placer d’autres services dans votre réseau, comme un bus d’événements ou des bases de données, ou que vous souhaitez connecter votre réseau à votre réseau local.

Entrepôts SQL classiques

Un entrepôt SQL classique prend en charge Photon, mais ne prend pas en charge les E/S prédictifs ou la gestion intelligente des charges de travail. Avec un entrepôt SQL classique (contrairement à un entrepôt SQL serverless), la couche de calcul existe dans votre compte d’abonnement Azure plutôt que dans votre compte Azure Databricks. Sans prise en charge de la gestion prédictive des E/S ou des charges de travail intelligentes, un entrepôt SQL classique fournit uniquement des performances d’entrée de niveau et moins de performances qu’un entrepôt SQL serverless ou professionnel. Un entrepôt SQL classique prend également plusieurs minutes pour démarrer (généralement environ 4 minutes) et réagit moins rapidement en matière de mise à l'échelle ou de réduction d'échelle qu'un entrepôt SQL sans serveur. Consultez la logique de mise en file d'attente et de mise à l’échelle automatique.

Utilisez un entrepôt SQL classique pour exécuter des requêtes interactives pour l’exploration des données avec des performances d’entrée de niveau et des fonctionnalités Databricks SQL.

Remarque

Pour plus d’informations sur le dimensionnement de votre entrepôt SQL et sa mise à l’échelle en réponse à la mise en file d’attente des requêtes, consultez la logique de mise à l’échelle automatique des files d’attente.

Quelles sont les valeurs par défaut du type d’entrepôt ?

Pour les espaces de travail dans les régions qui prennent en charge les entrepôts SQL serverless et répondent aux exigences :

  • À l’aide de l’interface utilisateur, le type d’entrepôt SQL par défaut est serverless.

  • À l’aide de l’API SQL Warehouses avec des paramètres par défaut, le type d’entrepôt SQL par défaut est classique. Pour utiliser serverless, définissez le enable_serverless_compute paramètre sur true et warehouse_type sur pro. Si cet espace de travail a utilisé l’API SQL Warehouses pour créer un entrepôt entre le 1er novembre 2022 et le 19 mai 2023 et répond aux exigences des entrepôts SQL serverless, la valeur par défaut reste définie truesur . Pour éviter toute ambiguïté, en particulier pour les organisations avec de nombreux espaces de travail, Databricks recommande de toujours définir ce champ.

  • Si l’espace de travail utilise un metastore Hive externe hérité, les entrepôts SQL sans serveur ne sont pas pris en charge. Le type d’entrepôt SQL par défaut est le même que si le calcul serverless a été désactivé, ce qui est professionnel dans l’interface utilisateur et classique à l’aide de l’API. Contactez également votre équipe de compte Azure Databricks pour en savoir plus sur Unity Catalog ou d’autres options.

Pour les espaces de travail qui ne prennent pas en charge les entrepôts SQL sans serveur :

  • À l’aide de l’interface utilisateur, le type d’entrepôt SQL par défaut est pro.
  • À l’aide de l’API SQL Warehouses avec des paramètres par défaut, le type d’entrepôt SQL par défaut est classique.