Partager via


Ressources déployées avec Clusters Big Data SQL Server

S’applique à : SQL Server 2019 (15.x)

Important

Le module complémentaire Clusters Big Data Microsoft SQL Server 2019 sera mis hors service. La prise en charge de la plateforme Clusters Big Data Microsoft SQL Server 2019 se terminera le 28 février 2025. Tous les utilisateurs existants de SQL Server 2019 avec Software Assurance seront entièrement pris en charge sur la plateforme, et le logiciel continuera à être maintenu par les mises à jour cumulatives SQL Server jusqu’à ce moment-là. Pour plus d’informations, consultez le billet de blog d’annonce et les Options Big Data sur la plateforme Microsoft SQL Server.

Cet article décrit les ressources déployées par un cluster Big Data SQL Server.

Un cluster Big Data déploie des pods en fonction du profil de déploiement. Pour plus d’informations, consultez Configurations par défaut.

Cet article décrit les pods déployés avec un profil aks-dev-test-ha et comprend un pool Spark. Interrogez Kubernetes pour voir les pods déployés dans votre cluster. L’exemple suivant retourne une liste de pods sous un espace de noms spécifique.

kubectl get pods -n <namespace>

Remplacez <namespace> par le nom de votre cluster Big Data.

Pour plus d’informations, consultez Guide pratique pour déployer Clusters Big Data SQL Server sur Kubernetes.

Le diagramme suivant montre les composants déployés dans un cluster Big Data :

big-data-cluster-diagram

Pour plus d’informations sur l’architecture, consultez Présentation des Clusters Big Data SQL Server.

Pods déployés

Le tableau suivant liste les pods déployés dans un cluster Big Data.

Nom Domaine
control-<nnnn> Contrôle
controldb-<#> Contrôle
controlwd-<nnnn> Contrôle
logsdb-<#> Contrôle
logsui-<nnnn> Contrôle
metricsdb-<#> Contrôle
metricsdc-<nnnn> Contrôle
metricsui-<nnnn> Contrôle
mgmtproxy-<nnnn> Contrôle
zookeeper-<#> Contrôle
dns-<nnnn> Contrôle
master-<#n> Instance maître
operator-<nnnn> Instance maître
compute-<#n>-<#m> Pool de calcul
data-<#>-<#> Pool de données
storage-<#>-<#> Pool de stockage
nmnode-<#>-<#> Pool de stockage
sparkhead-<#> Pool de stockage
appproxy-<#m> Pool d’applications
gateway-<#> Service de passerelle

Tous les pods ne sont pas inclus dans chaque cluster Big Data. Les déploiements avec une haute disponibilité ou une intégration à Active Directory incluent des pods spécifiques.

Pods propres à la haute disponibilité :

  • operator-<nnnn>
  • zookeeper-<#>

Pod propres à Active Directory :

  • dns-<nnnn>

Les sections suivantes décrivent les pods et listent les conteneurs dans chaque pod.

Control

Les pods de contrôle fournissent le service de contrôle.

Nom du pod Count Type de contrôleur Kubernetes Containers
control-# 1 ReplicaSet - controller

- security-support

- fluentbit
controldb 1 StatefulSet - mssql-server

- fluentbit
controlwd 1 ReplicaSet - controlwatchdog
logsdb-# 1 StatefulSet - elasticsearch
logsui 1 ReplicaSet - kibana
metricsdb-# 1 StatefulSet - influxdb
metricsdc 1 par nœud Kubernetes. DaemonSet - telegraf
metricsui-nnnn 1 ReplicaSet - grafana
mgmtproxy-nnnn 1 ReplicaSet - service-proxy

- fluentbit
dns-nnnn 0 ou 1 pour l’intégration à Active Directory ReplicaSet - dns

- fluentbit

Instance principale

master-<#n> est l’instance maître SQL Server.

  • Gère le pool de données via DDL
  • Manipule les données dans le pool de données via DML
  • Déplace l’exécution des requêtes analytiques vers le pool de données
Nom du pod Count Type de contrôleur Kubernetes Containers
master-<#n> 1 ou plus pour la haute disponibilité. StatefulSet - mssql-server

- fluentbit

- collectd

- mssql-ha-supervisor *
operator* 0 ou 1 pour la haute disponibilité ReplicaSet - mssql-ha-operator

* Uniquement les déploiements à haute disponibilité. L’opérateur implémente et inscrit la définition de ressource personnalisée pour SQL Server et les ressources de groupe de disponibilité. Quand l’opérateur est déployé, il s’inscrit lui-même en tant qu’écouteur pour les notifications relatives aux ressources SQL Server déployées dans le cluster Kubernetes. mssql-ha-supervisor prend en charge le groupe de disponibilité.

Chaque pod master contient une instance de SQL Server. Un déploiement à haute disponibilité comprend trois pods. Chaque pod comprend une instance de SQL Server avec des bases de données dans un groupe de disponibilité Always On SQL Server.

Ajoutez des pods supplémentaires au moment du déploiement, en fonction de votre charge de travail.

Pool de calcul

Le pool de calcul fournit une instance de SQL Server pour le calcul.

Nom du pod Count Type de contrôleur Kubernetes Containers
compute-<#n>-<#m> 1 ou plus. StatefulSet - mssql-server

- fluentbit

- collectd
  • #n identifie le pool de calcul.
  • #m identifie l’ID d’instance dans le pool.

Les instances du pool de calcul SQL Server sont sans état. Elles nécessitent uniquement le stockage pour tempdb.

Ajoutez des pods supplémentaires au moment du déploiement, en fonction de votre charge de travail.

Pool de données

Le pool de données fournit des instances de SQL Server pour le stockage et le calcul.

Nom du pod Count Type de contrôleur Kubernetes Containers
data-<#n>-<#m> 0 ou plus StatefulSet - mssql-server

- fluentbit

- collectd
  • #n identifie le pool de données.
  • #m identifie l’ID d’instance dans le pool.

Ajoutez des pods supplémentaires au moment du déploiement, en fonction de la charge de travail.

Pool de stockage

Le pool de stockage fournit l’ingestion des données par le biais de Spark, le stockage dans HDFS, l’accès aux données par le biais de HDFS et des points de terminaison SQL Server.

Nom du pod Count Type de contrôleur Kubernetes Containers
storage-0-# 1 ou plus. Ajoutez des pods supplémentaires au moment du déploiement, en fonction de la charge de travail. StatefulSet - hadoop

- mssql-server

- fluentbit

nmnode-0-# 1 ou plus pour la haute disponibilité StatefulSet - hadoop

- fluentbit
sparkehead-# 1 ou plus pour la haute disponibilité StatefulSet - hadoop-yarn-jobhistory

- hadoop-livy-sparkhistory

- hadoop-hivemetastore

-- fluentbit
zookeeper 0 ou 3 pour la haute disponibilité. StatefulSet - zookeeper

- fluentbit

Pool d'applications

Le pool d’applications est inclus dans certains profils de configuration de test. Le pool d’applications héberge des proxys de service d’application que vous définissez quand vous déployez vos applications pour des clusters Big Data.

appproxy est une API web qui se trouve devant les applications du pool d’applications. Elle authentifie les utilisateurs, puis route les requêtes vers les applications.

Nom du pod Type de contrôleur Kubernetes Containers
appproxy ReplicaSet - app-service-proxy

- fluentbit

Pour plus d’informations, consultez Présentation du déploiement d’application sur un cluster Big Data.

Ajoutez des pods supplémentaires au moment du déploiement, en fonction de la charge de travail.

Service de passerelle

Les services de passerelle fournissent la passerelle Knox à Spark, HDFS, Yarn, l’interface utilisateur Yarn et l’interface utilisateur Spark.

Nom du pod Type de contrôleur Kubernetes Containers
gateway-<#> StatefulSet - knox

- fluentbit

Une seule passerelle est prise en charge.

Références de conteneur open source

Pour plus d’informations sur des versions et projets open source spécifiques, consultez Informations de référence sur les logiciels Open Source.

Étapes suivantes

Pour en savoir plus sur les Clusters Big Data SQL Server, consultez les ressources suivantes :