Partager via


Présentation des pools de calcul dans les clusters Big Data SQL Server

S’applique à : SQL Server 2019 (15.x)

Important

Le module complémentaire Clusters Big Data Microsoft SQL Server 2019 sera mis hors service. La prise en charge de la plateforme Clusters Big Data Microsoft SQL Server 2019 se terminera le 28 février 2025. Tous les utilisateurs existants de SQL Server 2019 avec Software Assurance seront entièrement pris en charge sur la plateforme, et le logiciel continuera à être maintenu par les mises à jour cumulatives SQL Server jusqu’à ce moment-là. Pour plus d’informations, consultez le billet de blog d’annonce et les Options Big Data sur la plateforme Microsoft SQL Server.

Cet article décrit le rôle des pools de calcul SQL Server dans un cluster Big Data SQL Server. Les pools de calcul fournissent des ressources de calcul de scale-out pour un cluster Big Data SQL Server. Ils servent à déplacer le travail de calcul, ou les jeux de résultats intermédiaires, à partir de l’instance maître SQL Server. Les sections suivantes décrivent l’architecture, les fonctionnalités et les scénarios d’utilisation d’un pool de calcul.

Vous pouvez également regarder cette vidéo de 5 minutes pour une introduction aux pools de calcul :

Architecture d’un pool de calcul

Un pool de calcul est constitué d’un ou de plusieurs pods de calcul exécutés dans Kubernetes. La création et la gestion automatisées de ces pods sont coordonnées par l’instance maître de SQL Server. Chaque pod contient un ensemble de services de base, ainsi qu’une instance du moteur de base de données SQL Server.

Architecture d’un pool de calcul

Groupes de scale-out

Un pool de calcul peut servir de groupe de scale-out PolyBase pour les requêtes distribuées sur différentes sources de données externes telles que SQL Server, Oracle, MongoDB, Teradata et HDFS. Si vous utilisez des pods de calcul dans Kubernetes, les clusters Big Data SQL Server peuvent automatiser la création et la configuration de pods de calcul pour les groupes de scale-out PolyBase.

Scénarios de pool de calcul

Le pool de calcul est utilisé dans les scénarios suivants :

  • Lorsque les requêtes soumises à l’instance maître utilisent une ou plusieurs tables situées dans le pool de stockage.

  • Lorsque les requêtes soumises à l’instance maître utilisent une ou plusieurs tables avec une distribution par tourniquet situées dans le pool de données.

  • Lorsque les requêtes soumises à l’instance maître utilisent des tables partitionnées avec des sources de données externes SQL Server, Oracle, MongoDB et Teradata. Pour ce scénario, l’indicateur de requête OPTION (FORCE SCALEOUTEXECUTION) doit être activé

  • Lorsque les requêtes soumises à l’instance maître utilisent une ou plusieurs tables situées dans la hiérarchisation HDFS.

Le pool de calcul n’est pas utilisé dans les scénarios suivants :

  • Lorsque les requêtes soumises à l’instance maître utilisent une ou plusieurs tables dans un cluster Hadoop HDFS externe

  • Lorsque les requêtes soumises à l’instance maître utilisent une ou plusieurs tables dans Stockage Blob Azure

  • Lorsque les requêtes soumises à l’instance maître utilisent des tables non partitionnées avec des sources de données externes SQL Server, Oracle, MongoDB et Teradata.

  • Lorsque l’indicateur de requête OPTION (DISABLE SCALEOUTEXECUTION) est activé

  • Lorsque les requêtes soumises à l’instance maître s’appliquent à des bases de données situées sur l’instance maître

Étapes suivantes

Pour en savoir plus sur les Clusters Big Data SQL Server, consultez les ressources suivantes :