Notes
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Microsoft Fabric fournit une prise en charge R intégrée pour Apache Spark. Cela inclut la prise en charge de SparkR et sparklyr, ce qui permet aux utilisateurs d’interagir avec Spark à l’aide d’interfaces Spark ou R familières. Vous pouvez analyser des données à l’aide de R via des définitions de travaux par lots Spark ou avec des notebooks Microsoft Fabric interactifs.
Ce document fournit une vue d’ensemble du développement d’applications Spark dans Synapse à l’aide du langage R.
Conditions préalables
Souscrivez à un abonnement Microsoft Fabric . Vous pouvez également vous inscrire à une version d’évaluation gratuite de Microsoft Fabric .
Connectez-vous à Microsoft Fabric.
Utilisez le sélecteur d’expérience en bas à gauche de votre page d’accueil pour basculer vers Fabric.
Créer et exécuter des sessions de notebook
Le notebook Microsoft Fabric est une interface web qui vous permet de créer des fichiers qui contiennent du code en direct, des visualisations et du texte de narration. Les notebooks sont un bon endroit pour valider des idées et utiliser des expériences rapides pour obtenir des insights à partir de vos données. Les notebooks sont également largement utilisés dans la préparation des données, la visualisation des données, le Machine Learning et d’autres scénarios Big Data.
Pour démarrer avec R dans les notebooks Microsoft Fabric, modifiez la langue principale en haut de votre notebook en définissant l'option de langue sur SparkR (R).
En outre, vous pouvez utiliser plusieurs langues dans un bloc-notes en spécifiant la commande magique de langue au début d’une cellule.
%%sparkr
# Enter your R code here
Pour en savoir plus sur les carnets dans Microsoft Fabric Analytics, consultez Comment utiliser les carnets.
Installer des packages
Les bibliothèques fournissent du code réutilisable que vous souhaiterez peut-être inclure dans vos programmes ou projets. Pour rendre le code tiers ou généré localement disponible pour vos applications, vous pouvez installer une bibliothèque sur l’un de vos espaces de travail ou session de notebook.
Pour en savoir plus sur la gestion des bibliothèques R, consultez gestion des bibliothèques R.
Utilitaires de notebook
Les utilitaires Microsoft Spark (MSSparkUtils) sont un package intégré pour vous aider à effectuer facilement des tâches courantes. Vous pouvez utiliser MSSparkUtils pour travailler avec des systèmes de fichiers, obtenir des variables d’environnement, chaîner des notebooks ensemble et utiliser des secrets. MSSparkUtils est pris en charge pour les notebooks R.
Pour commencer, vous pouvez exécuter les commandes suivantes :
library(notebookutils)
mssparkutils.fs.help()
En savoir plus sur les commandes MSSparkUtils prises en charge dans Utiliser les utilitaires Microsoft Spark.
Utiliser SparkR
sparkR est un package R qui fournit un front-end léger pour utiliser Apache Spark à partir de R. SparkR fournit une implémentation de trame de données distribuée qui prend en charge les opérations telles que la sélection, le filtrage, l’agrégation, etc. SparkR prend également en charge le Machine Learning distribué à l’aide de MLlib.
Vous pouvez en savoir plus sur l’utilisation de SparkR en visitant Comment utiliser SparkR.
Utiliser sparklyr
sparklyr est une interface R pour Apache Spark. Il fournit un mécanisme permettant d’interagir avec Spark à l’aide d’interfaces R familières. Vous pouvez utiliser sparklyr via des définitions de travaux par lots Spark ou avec des notebooks Microsoft Fabric interactifs.
Pour en savoir plus sur l’utilisation de sparklyr, visitez Comment utiliser sparklyr.
Utiliser Tidyverse
Tidyverse est une collection de packages R que les scientifiques des données utilisent couramment dans les analyses de données quotidiennes. Il inclut des packages pour l’importation de données (readr
), la visualisation des données (ggplot2
), la manipulation des données (dplyr
, tidyr
), la programmation fonctionnelle (purrr
) et la création de modèles (tidymodels
) etc. Les packages de tidyverse
sont conçus pour fonctionner ensemble en toute transparence et suivre un ensemble cohérent de principes de conception. Microsoft Fabric distribue la dernière version stable de tidyverse
avec chaque version du runtime.
Pour en savoir plus sur l’utilisation de Tidyverse, visitez Comment utiliser Tidyverse.
Visualisation de R
L’écosystème R offre plusieurs bibliothèques de graphe qui sont fournies avec de nombreuses fonctionnalités différentes. Par défaut, chaque instance Spark dans Microsoft Fabric contient un ensemble de bibliothèques open source organisées et populaires. Vous pouvez également ajouter ou gérer des bibliothèques ou des versions supplémentaires à l’aide des fonctionnalités de gestion des bibliothèques microsoft Fabric .
Pour en savoir plus sur la création de visualisations R, consultez Visualisation R.