Konfigurieren eines SQL Server Big Data-Clusters vor CU9

Artikel
03/23/2023

Gilt für: SQL Server 2019 (15.x)

Wichtig

Das Microsoft SQL Server 2019-Big Data-Cluster-Add-On wird eingestellt. Der Support für SQL Server 2019-Big Data-Clusters endet am 28. Februar 2025. Alle vorhandenen Benutzer*innen von SQL Server 2019 mit Software Assurance werden auf der Plattform vollständig unterstützt, und die Software wird bis zu diesem Zeitpunkt weiterhin über kumulative SQL Server-Updates verwaltet. Weitere Informationen finden Sie im Ankündigungsblogbeitrag und unter Big Data-Optionen auf der Microsoft SQL Server-Plattform.

In Big Data-Clustern von SQL Server 2019 bis Release CU8 können Sie Big Data-Clustereinstellungen zur Bereitstellungszeit über die Bereitstellungsdatei bdc.json konfigurieren. Die SQL Server-Masterinstanz kann nach der Bereitstellung nur mithilfe der Datei „mssql-conf“ konfiguriert werden.

Hinweis

Vor CU9 und bevor Cluster unterstützt wurden, bei denen eine Konfiguration möglich ist, konnten Big Data-Cluster mit Ausnahme der SQL Server-Masterinstanz nur zum Zeitpunkt der Bereitstellung konfiguriert werden. Die SQL Server-Masterinstanz konnte nur mithilfe der Datei „mssql-conf“ nach der Bereitstellung konfiguriert werden. Eine Anleitung zum Konfigurieren von Releases ab CU9 finden Sie unter Konfigurieren eines Big Data-Clusters in SQL Server.

Konfigurationsebenen

Big Data-Cluster vor CU9 können auf zwei Ebenen konfiguriert werden: service und resource. Auch die Hierarchie der Einstellungen entspricht dieser Reihenfolge, von oben nach unten. BDC-Komponenten übernehmen den Wert der Einstellung auf, der auf der niedrigsten Ebene definiert ist. Wenn die Einstellung nicht auf einer bestimmten Ebene definiert ist, wird der Wert der übergeordneten Ebene übernommen.

Angenommen, Sie möchten die Standardanzahl der Kerne definieren, die der Spark-Treiber im Speicherpool und in Sparkhead-Ressourcen verwenden soll. Hierzu stehen zwei Möglichkeiten zur Verfügung:

Standardwert für Kerne auf der Dienstebene Spark angeben
Standardwert für Kerne auf der Ressourcenebene storage-0 und sparkhead angeben

Im ersten Szenario übernehmen alle Ressourcen auf niedrigeren Ebenen des Spark-Diensts (Speicherpool und Sparkhead) die Standardanzahl der Kerne vom Standardwert des Spark-Diensts.

Im zweiten Szenario nutzt jede Ressource den auf ihrer jeweiligen Ebene definierten Wert.

Wenn die Standardanzahl von Kernen sowohl auf Dienst- als auch auf Ressourcenebene konfiguriert ist, überschreibt der Wert für die Ressourcenebene den Wert für die Dienstebene, da dies die niedrigste vom Benutzer konfigurierte Ebene für die gegebene Einstellung ist.

Spezifische Informationen zur Konfiguration finden Sie in den folgenden entsprechenden Artikeln:

Konfigurieren der SQL Server-Masterinstanz

Konfigurieren Sie die Masterinstanz von Big Data-Cluster für SQL Server.

Die Serverkonfigurationseinstellungen der SQL Server-Masterinstanz können nicht zum Zeitpunkt der Bereitstellung konfiguriert werden. In diesem Artikel wird eine vorübergehende Problemumgehung beschrieben, mit der Einstellungen wie die SQL Server-Edition, das Aktivieren oder Deaktivieren des SQL Server-Agents, das Aktivieren spezifischer Ablaufverfolgungsflags oder das Aktivieren oder Deaktivieren von Kundenfeedback konfiguriert werden können.

Führen Sie die folgenden Schritte aus, um diese Einstellungen zu konfigurieren:

Erstellen Sie eine benutzerdefinierte mssql-custom.conf-Datei, die die gewünschten Einstellungen enthält. Im folgenden Beispiel werden der SQL Server-Agent, die Telemetrie und das Ablaufverfolgungsflag 1204 aktiviert sowie eine PID für die Enterprise Edition festgelegt:
```
[sqlagent]
enabled=true

[telemetry]
customerfeedback=true
userRequestedLocalAuditDirectory = /tmp/audit

[DEFAULT]
pid = Enterprise

[traceflag]
traceflag0 = 1204
```
Kopieren Sie die mssql-custom.conf-Datei in /var/opt/mssql im mssql-server-Container, der sich im master-0-Pod befindet. Ersetzen Sie <namespaceName> durch den Namen des Big Data-Clusters.
```
kubectl cp mssql-custom.conf master-0:/var/opt/mssql/mssql-custom.conf -c mssql-server -n <namespaceName>
```

Starten Sie die SQL Server-Instanz neu. Ersetzen Sie <namespaceName> durch den Namen des Big Data-Clusters.

kubectl exec -it master-0  -c mssql-server -n <namespaceName> -- /bin/bash
supervisorctl restart mssql-server
exit

Wichtig

Wenn die SQL Server-Masterinstanz eine Verfügbarkeitsgruppenkonfiguration aufweist, kopieren Sie die mssql-custom.conf-Datei in alle master-Pods. Beachten Sie, dass jeder Neustart ein Failover auslöst. Sie müssen also sicherstellen, dass Sie diese Aktivität während Downtime durchführen.

Bekannte Einschränkungen

Für die oben genannten Schritte sind Administratorberechtigungen für den Kubernetes-Cluster erforderlich.
Sie können die Serversortierung für die SQL Server-Masterinstanz nach der Bereitstellung des Big Data-Clusters nicht ändern.

Konfigurieren von Apache Spark und Apache Hadoop

Zum Konfigurieren von Apache Spark und Apache Hadoop in Big Data-Clustern müssen Sie das Clusterprofil zum Zeitpunkt der Bereitstellung ändern.

Ein Big Data-Cluster verfügt über vier Konfigurationskategorien:

sql
hdfs
spark
gateway

sql, hdfs, spark und sql sind Dienste. Diese Dienste werden der jeweils gleichen benannten Konfigurationskategorie zugeordnet. Alle Gatewaykonfigurationen werden in Kategorie gateway eingeordnet.

Sämtliche Konfigurationen im Dienst hdfs zählen beispielsweise zu Kategorie hdfs. Beachten Sie, dass alle Konfigurationen für Hadoop (core-site), HDFS und Zookeeper zur Kategorie hdfs zählen und alle Konfigurationen für Livy, Spark, Yarn und Hive Metastore zur Kategorie spark.

Unter Unterstützte Konfigurationen sind die Eigenschaften von Apache Spark und Apache Hadoop aufgeführt, die Sie beim Bereitstellen eines Big Data-Clusters in SQL Server konfigurieren können.

In den folgenden Abschnitten sind die Eigenschaften aufgeführt, die Sie in einem Cluster nicht ändern können:

Nächste Schritte

Konfigurieren eines Big Data-Clusters in SQL Server

Share via