Share via


Einführung in Computepools in SQL Server-Big Data-Clustern

Gilt für: SQL Server 2019 (15.x)

Wichtig

Das Microsoft SQL Server 2019-Big Data-Cluster-Add-On wird eingestellt. Der Support für SQL Server 2019-Big Data-Clusters endet am 28. Februar 2025. Alle vorhandenen Benutzer*innen von SQL Server 2019 mit Software Assurance werden auf der Plattform vollständig unterstützt, und die Software wird bis zu diesem Zeitpunkt weiterhin über kumulative SQL Server-Updates verwaltet. Weitere Informationen finden Sie im Ankündigungsblogbeitrag und unter Big Data-Optionen auf der Microsoft SQL Server-Plattform.

In diesem Artikel ist die Rolle beschrieben, die SQL Server-Computepools in einem Big Data-Cluster für SQL Server spielen. Computepools stellen horizontal skalierbare Computeressourcen für einen SQL Server-Big Data-Cluster bereit. Sie werden verwendet, um Berechnungsarbeit oder Zwischenresultsets aus der SQL Server-Masterinstanz auszulagern. In den folgenden Abschnitten werden die Architektur, die Funktionen und die Nutzungsszenarios eines Computepools beschrieben.

Dieses fünfminütige Video enthält eine Einführung in Computepools:

Computepoolarchitektur

Ein Computepool besteht aus mindestens einem Compute-Pod, der in Kubernetes ausgeführt wird. Das automatisierte Erstellen und Verwalten dieser Pods wird von der SQL Server-Masterinstanz koordiniert. Jeder Pod enthält eine Reihe von Basisdiensten und eine Instanz der SQL Server-Datenbank-Engine.

Computepoolarchitektur

Erweiterungsgruppen

Ein Computepool kann als PolyBase-Erweiterungsgruppe für verteilte Abfragen über verschiedene externe Datenquellen fungieren, etwa SQL Server, Oracle, MongoDB, Teradata und HDFS. Durch Verwenden von Computepods in Kubernetes kann in einem SQL Server-Big Data-Cluster das Erstellen und Konfigurieren von Computepods für PolyBase-Erweiterungsgruppen automatisiert werden.

Computepoolszenarien

In den folgenden Szenarien werden Computepools verwendet:

  • Wenn bei der Masterinstanz eingereichte Abfragen Tabellen verwenden, die sich im Speicherpool befinden.

  • Wenn bei der Masterinstanz eingereichte Abfragen Tabellen verwenden, die sich im Datenpool befinden und Roundrobin-Verteilung verwenden.

  • Wenn bei der Masterinstanz eingereichte Abfragen partitionierte Tabellen mit externen Datenquellen in SQL Server, Oracle, MongoDB oder Teradata verwenden. Für dieses Szenario muss der Abfragehinweis OPTION (FORCE SCALEOUTEXECUTION) aktiviert sein.

  • Wenn bei der Masterinstanz eingereichte Abfragen Tabellen verwenden, die sich im HDFS-Tiering befinden.

In den folgenden Szenarien werden keine Computepools verwendet:

  • Wenn bei der Masterinstanz eingereichte Abfragen Tabellen verwenden, die sich in einem externen Hadoop HDFS-Cluster befinden.

  • Wenn bei der Masterinstanz eingereichte Abfragen Tabellen verwenden, die sich in Azure Blob Storage befinden.

  • Wenn bei der Masterinstanz eingereichte Abfragen nicht partitionierte Tabellen mit externen Datenquellen in SQL Server, Oracle, MongoDB oder Teradata verwenden.

  • Wenn der Abfragehinweis OPTION (DISABLE SCALEOUTEXECUTION) aktiviert ist.

  • Wenn bei der Masterinstanz eingereichte Abfragen sich auf Datenbanken beziehen, die sich auf der Masterinstanz befinden.

Nächste Schritte

Weitere Informationen zu Big Data-Cluster für SQL Server finden Sie in den folgenden Ressourcen: