Partager via


Guide du runtime des Clusters Big Data SQL Server pour Apache Spark

S’applique à : SQL Server 2019 (15.x)

Important

Le module complémentaire Clusters Big Data Microsoft SQL Server 2019 sera mis hors service. La prise en charge de la plateforme Clusters Big Data Microsoft SQL Server 2019 se terminera le 28 février 2025. Tous les utilisateurs existants de SQL Server 2019 avec Software Assurance seront entièrement pris en charge sur la plateforme, et le logiciel continuera à être maintenu par les mises à jour cumulatives SQL Server jusqu’à ce moment-là. Pour plus d’informations, consultez le billet de blog d’annonce et les Options Big Data sur la plateforme Microsoft SQL Server.

Présentation du runtime des Clusters Big Data SQL Server pour Apache Spark

Le runtime des Clusters Big Data SQL Server pour Apache Spark est une spécification standardisée pour Apache Spark qui permet une interopérabilité transparente entre distributions. Ce runtime Spark est un bloc cohérent et versionné des distributions de langage de programmation, d’optimisations de moteur, de bibliothèques principales et de packages.

Chaque produit qui utilise cette spécification de runtime contient les mêmes versions d’Apache Spark Core, de PySpark, de Scala Spark, de Spark.R, de sparklyr et de .NET pour Spark.

Tous les packages et bibliothèques distribués sont également les mêmes. L’un des principaux objectifs de la spécification est de fournir une expérience de premier ordre aux ingénieurs des données et aux scientifiques des données en leur offrant une liste constamment organisée et mise à jour de packages et de connecteurs, prêts à l’emploi.

Avantages du runtime des Clusters Big Data SQL Server pour Apache Spark :

  1. Optimisations et fonctionnalités du moteur Spark disponibles sur tous les produits et services
  2. Cadence de publication établie
  3. Interopérabilité transparente entre les produits et services Spark
  4. Packages organisés pour les ingénieurs des données et les scientifiques des données
  5. Efficacité de la gestion cohérente des packages

Cadence des versions et conventions de nommage

La spécification du runtime des Clusters Big Data SQL Server pour Apache Spark définit les éléments suivants :

La convention de nommage du runtime est le suivant :

« PRODUCT_NAME.SPARK_MAJOR_VERSION.CALENDAR_YEAR.RELEASE# »

Exemple : « BDC.3.2021.1 ».

RELEASE# est un nombre sémantique séquentiel. Il n’est pas lié aux mois ou à une autre norme. Quand une version de runtime est créée, elle est immuable. Chaque version des Clusters Big Data SQL Server est fournie avec une version du runtime.

Que comprend la version actuelle du runtime ?

Les notes de publication de la plateforme Clusters Big Data SQL Server contiennent le nom du runtime et l’intégralité du contenu de la version.

Étapes suivantes

Pour plus d’informations, consultez Présentation des Clusters Big Data SQL Server.