Leitfaden zur Runtime von SQL Server Big Data-Cluster für Apache Spark

Gilt für: SQL Server 2019 (15.x)

Wichtig

Das Microsoft SQL Server 2019-Big Data-Cluster-Add-On wird eingestellt. Der Support für SQL Server 2019-Big Data-Clusters endet am 28. Februar 2025. Alle vorhandenen Benutzer*innen von SQL Server 2019 mit Software Assurance werden auf der Plattform vollständig unterstützt, und die Software wird bis zu diesem Zeitpunkt weiterhin über kumulative SQL Server-Updates verwaltet. Weitere Informationen finden Sie im Ankündigungsblogbeitrag und unter Big Data-Optionen auf der Microsoft SQL Server-Plattform.

Einführung in die Runtime von SQL Server Big Data-Cluster für Apache Spark

Die Runtime von SQL Server Big Data-Cluster für Apache Spark ist eine standardisierte Spezifikation für Apache Spark, die nahtlose Interoperabilität zwischen Distributionen ermöglicht. Diese Spark-Runtime ist ein konsistenter, versionierter Block aus Programmiersprachenverteilungen, Engineoptimierung, Kernbibliotheken und Paketen.

Jedes Produkt, das diese Runtime-Spezifikation verwendet, enthält die gleichen Versionen von Apache Spark Core, PySpark, Scala Spark, SparkR und .NET für Spark.

Alle verteilten Pakete und Bibliotheken sind ebenfalls identisch. Eines der Hauptziele der Spezifikation besteht darin, Data Engineers und Data Scientists eine erstklassige Benutzeroberfläche zu bieten, in der eine betriebsfertige, dauerhaft kuratierte und aktualisierte Paket- und Connektorliste zur Verfügung gestellt wird.

Vorteile der SQL Server Big Data-Cluster Runtime für Apache Spark:

  1. Optimierungen und Features für die Spark-Engine, die für alle Produkte und Dienste verfügbar sind
  2. Festgelegter Release-Rhythmus
  3. Nahtlose Interoperabilität zwischen Spark-Produkten und -Diensten
  4. Kuratierte Pakete für Data Engineers und Data Scientists
  5. Konsistente Übersicht über den Verlauf der Paketverwaltung

Releaserhythmus und Benennungsstandards

Die SQL Server Big Data-Cluster-Runtime für die Apache Spark-Spezifikation definiert Folgendes:

Der Benennungsstandard der Runtime ist wie folgt:

PRODUKTNAME.SPARK_HAUPTVERSION.KALENDERJAHR.RELEASE#

Beispiel: „BDC.3.2021.1“

RELEASE# ist eine sequentielle semantische Zahl. Sie ist nicht an Monate oder einen anderen Standard gebunden. Sobald eine Runtime-Release erstellt wurde, ist es unveränderlich. Jedes Release des SQL Server Big Data-Clusters wird mit einer Version der Runtime ausgeliefert.

Was ist in dem aktuellen Runtime-Release?

Die Versionshinweise der SQL Server Big Data-Cluster-Plattform enthalten den Runtime-Namen und den vollständigen Inhalt des Release.

Nächste Schritte

Weitere Informationen finden Sie hier: Einführung in Big Data-Cluster für SQL Server.