Partager via


Runtime Fabric 1.3 (Disponibilité générale)

Le Runtime Fabric offre une intégration transparente avec Azure. Il fournit un environnement sophistiqué pour les projets d’Ingénieurs de données, et de science des données qui utilisent Apache Spark. Cet article présente une vue d’ensemble des caractéristiques et des composants essentiels de Fabric Runtime 1.3, le plus récent runtime pour les calculs de Big Data.

Microsoft Fabric Runtime 1.3 est la dernière version du runtime en disponibilité générale et intègre les composants et mises à niveau suivants, conçus pour améliorer vos fonctionnalités de traitement de données :

  • Apache Spark 3.5

  • Système d’exploitation : Mariner 2.0

  • Java : 11

  • Scala : 2.12.17

  • Python : 3.11

  • Delta Lake : 3.2

  • R : 4.4.1

    Conseil

    Fabric Runtime 1.3 inclut la prise en charge du moteur d’exécution natif, ce qui peut améliorer considérablement les performances sans plus de coûts. Pour activer le moteur d’exécution natif sur tous les travaux et notebooks de votre environnement, accédez à vos paramètres d’environnement, sélectionnez Calcul Spark, accédez à l’onglet Accélération et cochez Activer le moteur d’exécution natif. Une fois que vous avez enregistré et publié, ce paramètre est appliqué dans l’environnement, de sorte que tous les nouveaux jobs et notebooks héritent automatiquement et bénéficient d'une performance améliorée.

Intégrer Runtime 1.3

Utilisez les instructions suivantes, pour intégrer runtime 1.3 à votre espace de travail, et utiliser ses nouvelles fonctionnalités :

  1. Accédez à la tabulation Paramètres de l’espace de travail dans votre espace de travail Fabric.

  2. Accédez à tabulation Ingénieurs de données/Science et sélectionnez Paramètres Spark.

  3. Sélectionnez l’onglet Environnement.

  4. Sous les Versions du runtime, développez la liste déroulante.

  5. Sélectionnez 1.3 (Spark 3.5, Delta 3.2) et enregistrez vos modifications. Cette action définit la version 1.3 en tant que runtime par défaut pour votre espace de travail.

    Capture d'écran montrant où sélectionner la version du runtime.

Vous pouvez maintenant commencer à utiliser les dernières améliorations et fonctionnalités introduites dans le runtime Fabric 1.3 (Spark 3.5 et Delta Lake 3.2).

En savoir plus sur Apache Spark 3.5

L’Apache Spark 3.5.0 est la sixième version de la série 3.x. Cette version est le fruit d’une vaste collaboration au sein de la communauté open-source, qui a permis de résoudre plus de 1 300 problèmes enregistrés dans Jira.

Dans cette version, il existe une mise à niveau en compatibilité pour le flux structuré. En outre, cette version élargit les fonctionnalités de PySpark et de SQL. En outre, cette version élargit les fonctionnalités de PySpark et de SQL. Elle intègre des caractéristiques telles que la clause d’identifiant SQL, les arguments nommés dans les appels de fonctions SQL et l’inclusion de fonctions SQL pour les agrégations approximatives d’HyperLogLog.

D’autres nouvelles fonctionnalités incluent également des fonctions de table définies par l’utilisateur Python, la simplification de la formation distribuée via DeepSpeed et de nouvelles fonctionnalités de streaming structurées telles que la propagation de filigranes et l’opération dropDuplicatesWithinWatermark.

Vous pouvez consulter la liste complète et les modifications détaillées ici : Spark Release 3.5.0.

En savoir plus sur Delta Spark

Delta Lake 3.2 marque un engagement collectif à rendre Delta Lake interopérable sur l’ensemble des formats, plus facile à utiliser et plus performant. Delta Spark 3.2 est développé sur Apache Spark™ 3.5. L’artefact maven Delta Spark est renommé delta-core en delta-spark.

Vous pouvez consulter la liste complète et les changements précis ici : https://docs.delta.io/index.html.

Composants et bibliothèques

Pour obtenir des informations à jour, et une liste détaillée des modifications et des notes de publication spécifiques pour les Runtimes d’exécution Fabric, consultez les versions et mises à jour de Spark Runtimes et abonnez-vous.

Note

EventHubConnector est déconseillé dans Fabric Runtime 1.3 (Spark 3.5) et sera supprimé des futures versions de Fabric Runtime. Les clients sont encouragés à utiliser le connecteur Kafa Spark à la place, car Event Hubs est déjà compatible avec Kafka. Vous trouverez plus d’informations sur l’utilisation du connecteur Kafa Spark avec Event Hubs ici : Didacticiel Event Hubs Kafka Spark