Types d’entrepôts SQL

Article
09/16/2024

Databricks SQL prend en charge les types d’entrepôt SQL suivants :

Sans serveur
Pro
Classique

Chaque type d’entrepôt SQL a des niveaux de performance différents. Le tableau suivant présente les fonctionnalités de niveau de performance prises en charge par chaque type d’entrepôt SQL.

Type d’entrepôt	Photon Engine	E/S prédictives	Gestion intelligente des charges de travail
Sans serveur	X	X	X
Pro	X	X
Classique	X

La liste suivante décrit chaque fonctionnalité de niveau de performance :

Photon : moteur de requête vectorisé natif sur Databricks. Il rend vos appels d’API SQL et DataFrame existants plus rapides et réduit votre coût total par charge de travail.
E/S prédictives : suite de fonctionnalités permettant d’accélérer les opérations d’analyse sélectives dans les requêtes SQL. Les E/S prédictives peuvent fournir un large éventail d’accélérations.
Gestion intelligente des charges de travail (Intelligent Workload Management/IWM) : ensemble de fonctionnalités qui améliore la capacité de Databricks SQL Serverless à traiter un grand nombre de requêtes rapidement et de manière rentable. À l’aide de techniques de prédiction et de gestion dynamique optimisées par l’IA, IWM vous permet de garantir que les charges de travail disposent rapidement de la bonne quantité de ressources. La principale différence réside dans les fonctionnalités d’IA de Databricks SQL pour répondre dynamiquement aux demandes de charge de travail plutôt que d’utiliser des seuils statiques.

Remarque

Pour connaître la tarification de chaque type d’entrepôt et obtenir une comparaison détaillée des fonctionnalités, consultez l’article Databricks SQL. Pour en savoir plus sur les dernières fonctionnalités SQL Databricks, consultez Notes de publication de Databricks SQL.

Différences de niveau de performance entre les types d’entrepôt SQL

Chaque type d’entrepôt SQL a des caractéristiques de niveau de performance différentes.

Entrepôts SQL serverless

Grâce à l’architecture serverless Azure Databricks, les entrepôts SQL serverless prennent en charge toutes les fonctionnalités de niveau de performance de Databricks SQL. Avec les entrepôts SQL serverless et leurs fonctionnalités de niveau de performance, vous obtenez :

Temps de démarrage rapide (généralement entre 2 et 6 secondes).
Montée en puissance rapide pour acquérir plus de ressources de calcul lorsque cela est nécessaire pour maintenir une latence faible.
Admission de requêtes plus proche de la limitation du matériel plutôt que de la machine virtuelle.
Réduction rapide de la capacité pour minimiser les coûts lorsque la demande est faible, assurant des performances constantes avec des coûts et des ressources optimisés.

Pour des performances de démarrage optimales, des E/S plus efficaces, une gestion plus intelligente d’une demande de requête qui varie considérablement au fil du temps et une mise à l’échelle automatique rapide lorsque la mise en file d’attente des requêtes se produit, choisissez les entrepôts SQL serverless. Consultez Mise à l’échelle automatique et mise en file d’attente des requêtes serverless.

Les entrepôts SQL serverless fonctionnent bien avec ces types de charges de travail :

ETL
Décisionnel
Analyse exploratoire

Important

Les entrepôts SQL ne prennent pas en charge le passage des informations d’identification. Databricks recommande d’utiliser Unity Catalog pour la gouvernance des données. Consultez Qu’est-ce que Unity Catalog ?.

Entrepôts Pro SQL

Les entrepôts SQL pro prennent en charge Photon et les E/S prédictives, mais ne prennent pas en charge la gestion intelligente des charges de travail. Avec les entrepôts SQL pro (contrairement aux entrepôts SQL serverless), la couche de calcul existe dans votre compte d’abonnement Azure plutôt que dans votre compte Azure Databricks. Par conséquent, les entrepôts SQL ne prennent pas en charge la gestion intelligente des charges de travail, ce qui les rend moins réactifs à une demande de requête qui varie considérablement au fil du temps et incapables de se mettre à l’échelle automatiquement aussi rapidement que les entrepôts SQL serverless. Les entrepôts SQL pro ont besoin de plusieurs minutes pour démarrer (généralement environ 4 minutes) et sont moins réactifs que les entrepôts SQL serverless en cas de scale-up ou de scale-down. Consultez Mise en file d’attente et mise à l’échelle automatique pour les entrepôts SQL professionnels et classiques.

Utilisez les entrepôts SQL pro quand :

Les entrepôts SQL serverless ne sont pas disponibles dans une région.
Vous disposez d’une mise en réseau personnalisée et souhaitez vous connecter à des bases de données de votre réseau dans le cloud ou localement, pour une fédération ou une architecture de type hybride. Par exemple, utilisez un entrepôt Pro SQL si vous souhaitez placer d’autres services dans votre réseau, comme un bus d’évènements ou des bases de données, ou que vous souhaitez connecter votre réseau à votre réseau local.

Entrepôts SQL classiques

Les entrepôts SQL classiques prennent en charge Photon, mais ne prennent pas en charge les E/S prédictives ou la gestion intelligente des charges de travail. Avec les entrepôts SQL classiques (contrairement aux entrepôts SQL serverless), la couche de calcul existe dans votre compte d’abonnement Azure plutôt que dans le compte Azure Databricks. Sans prise en charge des E/S prédictives ou des charges de travail intelligentes, les entrepôts SQL classiques n’offrent qu’un niveau de performance d’entrée de gamme et inférieur à celui des entrepôts SQL serverless ou pro. Les entrepôts SQL classiques ont également besoin de plusieurs minutes pour démarrer (généralement environ 4 minutes) et sont moins réactifs que les entrepôts SQL serverless en cas de scale-up ou de scale-down. Consultez Mise en file d’attente et mise à l’échelle automatique pour les entrepôts SQL professionnels et classiques.

Utilisez les entrepôts SQL classiques pour exécuter des requêtes interactives d’exploration des données avec un niveau de performance d’entrée de gamme et les fonctionnalités Databricks SQL.

Remarque

Pour plus d’informations sur le dimensionnement de vos entrepôts SQL et la façon dont vos entrepôts SQL se mettent à l’échelle en réponse à la mise en file d’attente des requêtes, consultez Mise en file d’attente et mise à l’échelle automatique pour les entrepôts SQL classiques et pro.

Quels sont les types d’entrepôt par défaut ?

Pour les espaces de travail dans les régions qui prennent en charge les entrepôts SQL serverless et qui répondent aux conditions requises :

Avec l’interface utilisateur, le type d’entrepôt SQL par défaut est serverless.
Avec l’API Entrepôts SQL avec les paramètres par défaut, le type d’entrepôt SQL par défaut est classique. Pour utiliser le type serverless, définissez le paramètre enable_serverless_compute sur true et warehouse_type sur pro. Si cet espace de travail a utilisé l’API Entrepôts SQL pour créer un entrepôt entre le 1er novembre 2022 et le 19 mai 2023 et qu’il répond aux conditions requises des entrepôts SQL serverless, le paramètre par défaut reste défini sur true. Pour éviter toute ambiguïté, en particulier pour les organisations disposant de nombreux espaces de travail, Databricks vous recommande de toujours définir ce champ.
Si l’espace de travail utilise un metastore Hive externe hérité, les entrepôts SQL serverless ne sont pas pris en charge. Le type d’entrepôt SQL par défaut est le même que si le calcul serverless était désactivé, à savoir Pro dans l’interface utilisateur et Classique avec l’API. Contactez également votre équipe de compte Azure Databricks pour en savoir plus sur Unity Catalog ou à propos d’autres options.

Pour les espaces de travail qui ne prennent pas en charge les entrepôts SQL serverless :

Avec l’interface utilisateur, le type d’entrepôt SQL par défaut est Pro.
Avec l’API Entrepôts SQL avec les paramètres par défaut, le type d’entrepôt SQL par défaut est classique.

Partage via