Mit Big Data-Cluster für SQL Server bereitgestellte Ressourcen

Artikel
03/23/2023

Gilt für: SQL Server 2019 (15.x)

Wichtig

Das Microsoft SQL Server 2019-Big Data-Cluster-Add-On wird eingestellt. Der Support für SQL Server 2019-Big Data-Clusters endet am 28. Februar 2025. Alle vorhandenen Benutzer*innen von SQL Server 2019 mit Software Assurance werden auf der Plattform vollständig unterstützt, und die Software wird bis zu diesem Zeitpunkt weiterhin über kumulative SQL Server-Updates verwaltet. Weitere Informationen finden Sie im Ankündigungsblogbeitrag und unter Big Data-Optionen auf der Microsoft SQL Server-Plattform.

In diesem Artikel werden die Ressourcen beschrieben, die von einem Big Data-Cluster für SQL Server bereitgestellt werden.

Mit einem Big Data-Cluster werden Pods auf dem Bereitstellungsprofil basierend bereitgestellt. Weitere Informationen finden Sie unter Standardkonfigurationen.

In diesem Artikel werden die Pods beschrieben, die mit dem Profil aks-dev-test-ha bereitgestellt werden. Zudem erhalten Sie Informationen über einen Spark-Pool. Führen Sie eine Abfrage für Kubernetes durch, um die in Ihrem Cluster bereitgestellten Pods anzuzeigen. Im folgenden Beispiel wird eine Liste von Pods unter einem bestimmten Namespace zurückgegeben.

kubectl get pods -n <namespace>

Ersetzen Sie <namespace> durch den Namen des Big Data-Clusters.

Weitere Informationen finden Sie unter Vorgehensweise: Bereitstellen von Big Data-Cluster für SQL Server auf Kubernetes.

Das folgende Diagramm zeigt die in einem Big Data-Cluster bereitgestellten Komponenten an:

Diagramm: Big Data-Cluster

Weitere Informationen zur Architektur finden Sie unter Einführung in Big Data-Cluster für SQL Server.

Bereitgestellte Pods

In der folgenden Tabelle sind die in einem Big Data-Cluster bereitgestellten Pods aufgeführt.

Name	Bereich
`control-<nnnn>`	Steuerung
`controldb-<#>`	Steuerung
`controlwd-<nnnn>`	Steuerung
`logsdb-<#>`	Steuerung
`logsui-<nnnn>`	Steuerung
`metricsdb-<#>`	Steuerung
`metricsdc-<nnnn>`	Steuerung
`metricsui-<nnnn>`	Steuerung
`mgmtproxy-<nnnn>`	Steuerung
`zookeeper-<#>`	Steuerung
`dns-<nnnn>`	Steuerung
`master-<#n>`	Masterinstanz
`operator-<nnnn>`	Masterinstanz
`compute-<#n>-<#m>`	Computepool
`data-<#>-<#>`	Datenpool
`storage-<#>-<#>`	Speicherpool
`nmnode-<#>-<#>`	Speicherpool
`sparkhead-<#>`	Speicherpool
`appproxy-<#m>`	Anwendungspool
`gateway-<#>`	Gatewaydienst

Nicht alle Pods sind in jedem Big Data-Cluster enthalten. Bereitstellungen mit Hochverfügbarkeit oder Active Directory-Integrationen beinhalten spezifische Pods.

Spezifische Pods für Hochverfügbarkeit:

operator-<nnnn>
zookeeper-<#>

Spezifische Pods für Active Directory:

dns-<nnnn>

In den folgenden Abschnitten werden die Pods beschrieben und die Container in jedem Pod aufgelistet.

Control

Steuerungspods stellen den Steuerungsdienst bereit.

Podname	Anzahl	Kubernetes-Controllertyp	Container
`control-#`	1	ReplicaSet	- `controller` - `security-support` - `fluentbit`
`controldb`	1	StatefulSet	- `mssql-server` - `fluentbit`
`controlwd`	1	ReplicaSet	- `controlwatchdog`
`logsdb-#`	1	StatefulSet	- `elasticsearch`
`logsui`	1	ReplicaSet	- `kibana`
`metricsdb-#`	1	StatefulSet	- `influxdb`
`metricsdc`	1 pro Kubernetes-Knoten	DaemonSet	- `telegraf`
`metricsui-nnnn`	1	ReplicaSet	- `grafana`
`mgmtproxy-nnnn`	1	ReplicaSet	- `service-proxy` - `fluentbit`
`dns-nnnn`	0 oder 1 für die Azure Active Directory-Integration	ReplicaSet	- `dns` - `fluentbit`

Master-Instanz

Bei master-<#n> handelt es sich um die SQL Server-Masterinstanz.

Verwaltet den Datenpool über DDL
Bearbeitet Daten im Daten Pool über DML
Lagert die analytische Abfrageausführung in den Datenpool aus

Podname	Anzahl	Kubernetes-Controllertyp	Container
`master-<#n>`	Mindestens 1 für Hochverfügbarkeit	StatefulSet	- `mssql-server` - `fluentbit` - `collectd` - `mssql-ha-supervisor` ^*
`operator`^*	0 oder 1 für Hochverfügbarkeit	ReplicaSet	- `mssql-ha-operator`

^* Nur für Bereitstellungen mit Hochverfügbarkeit. Der Operator implementiert und registriert die benutzerdefinierte Ressourcendefinition für SQL Server und die Verfügbarkeitsgruppenressourcen. Wenn der Operator bereitgestellt wird, registriert er sich selbst als Listener für Benachrichtigungen über SQL Server-Ressourcen, die im Kubernetes-Cluster bereitgestellt werden. mssql-ha-supervisor unterstützt die Verfügbarkeitsgruppe.

Jeder master-Pod enthält eine Instanz von SQL Server. Eine Bereitstellung mit Hochverfügbarkeit umfasst 3 Pods. Jeder Pod enthält eine SQL Server-Instanz mit Datenbanken in einer SQL Server-Always On-Verfügbarkeitsgruppe.

Schließen Sie je nach Arbeitsauslastung zum Zeitpunkt der Bereitstellung zusätzliche Pods ein.

Computepool

Der Computepool stellt eine SQL Server-Instanz für die Berechnung bereit.

Podname	Anzahl	Kubernetes-Controllertyp	Container
`compute-<#n>-<#m>`	Mindestens einer	StatefulSet	- `mssql-server` - `fluentbit` - `collectd`

#n identifiziert den Computepool.
#m identifiziert die Instanz-ID innerhalb des Pools.

Die SQL Server-Instanzen des Computepools sind zustandslos. Sie benötigen lediglich Speicher für tempdb.

Schließen Sie je nach Arbeitsauslastung zum Zeitpunkt der Bereitstellung zusätzliche Pods ein.

Datenpool

Der Datenpool bietet SQL Server-Instanzen für die Speicherung und das Computing.

Podname	Anzahl	Kubernetes-Controllertyp	Container
`data-<#n>-<#m>`	0 oder mehr	StatefulSet	- `mssql-server` - `fluentbit` - `collectd`

#n identifiziert den Datenpool.
#m identifiziert die Instanz-ID innerhalb des Pools.

Schließen Sie je nach Arbeitsauslastung zum Zeitpunkt der Bereitstellung zusätzliche Pods ein.

Speicherpool

Der Speicherpool ermöglicht die Datenerfassung über Spark, den Speicher in HDFS, den Datenzugriff über HDFS und SQL Server-Endpunkte.

Podname	Anzahl	Kubernetes-Controllertyp	Container
`storage-0-#`	Mindestens einer Schließen Sie je nach Arbeitsauslastung zum Zeitpunkt der Bereitstellung zusätzliche Pods ein.	StatefulSet	- `hadoop` - `mssql-server` - `fluentbit`
`nmnode-0-#`	Mindestens 1 für Hochverfügbarkeit	StatefulSet	- `hadoop` - `fluentbit`
`sparkehead-#`	Mindestens 1 für Hochverfügbarkeit	StatefulSet	- `hadoop-yarn-jobhistory` - `hadoop-livy-sparkhistory` - `hadoop-hivemetastore` -- `fluentbit`
`zookeeper`	0 oder 3 für Hochverfügbarkeit	StatefulSet	- `zookeeper` - `fluentbit`

Anwendungspool

Der Anwendungspool ist in einigen der Testkonfigurationsprofile enthalten. Der Anwendungspool hostet Anwendungsdienstproxys, die Sie definieren, wenn Sie Ihre Anwendungen für Big Data-Cluster bereitstellen.

appproxy ist eine Web-API, die sich vor den Anwendungen des Anwendungspools befindet. Sie authentifiziert Benutzer und leitet die Anforderungen dann an die Anwendungen weiter.

Podname	Kubernetes-Controllertyp	Container
`appproxy`	ReplicaSet	- `app-service-proxy` - `fluentbit`

Weitere Informationen finden Sie unter Einführung in die Anwendungsbereitstellung in einem Big Data-Cluster.

Schließen Sie je nach Arbeitsauslastung zum Zeitpunkt der Bereitstellung zusätzliche Pods ein.

Gatewaydienst

Der Gatewaydienst stellt das Knox-Gateway zu Spark, HDFS, Yarn, zur Yarn-Benutzeroberfläche und zur Spark-Benutzeroberfläche bereit.

Podname	Kubernetes-Controllertyp	Container
`gateway-<#>`	StatefulSet	- `knox` - `fluentbit`

Es wird nur ein Gateway unterstützt.

Referenzen zu Open-Source-Containern

Informationen zu bestimmten Open-Source-Projekten und -Versionen finden Sie unter Referenz zu Open-Source-Software.

Nächste Schritte

Weitere Informationen zu Big Data-Cluster für SQL Server finden Sie in den folgenden Ressourcen:

Share via

Mit Big Data-Cluster für SQL Server bereitgestellte Ressourcen

Bereitgestellte Pods

Spezifische Pods für Hochverfügbarkeit:

Spezifische Pods für Active Directory:

Control

Master-Instanz

Computepool

Datenpool

Speicherpool

Anwendungspool

Gatewaydienst

Referenzen zu Open-Source-Containern

Nächste Schritte

Feedback

Feedback

Zusätzliche Ressourcen