Gestion de bibliothèque R

Les bibliothèques fournissent du code réutilisable que vous souhaiterez peut-être inclure dans vos programmes ou projets pour Microsoft Fabric Spark.

Microsoft Fabric prend en charge un runtime R avec de nombreux packages R open source populaires, notamment TidyVerse, préinstallés. Lorsqu’une instance Spark démarre, ces bibliothèques sont incluses automatiquement et disponibles pour être utilisées immédiatement dans les notebooks ou les définitions de travaux Spark.

Vous devrez peut-être mettre à jour vos bibliothèques R pour différentes raisons. Par exemple, l’une de vos dépendances principales a publié une nouvelle version, ou votre équipe a créé un package personnalisé dont vous avez besoin dans vos clusters Spark.

Deux types de bibliothèques peuvent correspondre à votre scénario :

les bibliothèques Feed font référence aux bibliothèques résidant dans des sources ou référentiels publics, tels que CRAN ou GitHub.
bibliothèques personnalisées sont le code créé par vous ou votre organisation, .tar.gz pouvez être géré via les portails gestion des bibliothèques.

Il existe deux niveaux de packages installés sur Microsoft Fabric :

Environnement: gérez les bibliothèques via un environnement pour réutiliser le même ensemble de bibliothèques sur plusieurs blocs-notes ou travaux.
session : une installation de session crée un environnement pour une session de bloc-notes spécifique. La modification des bibliothèques de niveau session n’est pas persistante entre les sessions.

Modes de publication d’environnement (Rapide vs Complet)

Lorsque vous installez des bibliothèques dans un environnement Fabric, vous choisissez un mode de publication :

Le mode rapide publie en environ 5 secondes. Les bibliothèques s’installent quand une session de notebook démarre. Le mode rapide est idéal pour l’itération rapide pendant le développement.
Le mode complet crée un instantané de bibliothèque stable et reproductible. La publication prend généralement 3 à 6 minutes, et le démarrage de session ajoute 1 à 3 minutes pour le déploiement de dépendances.

Ces modes s’appliquent aux bibliothèques R au niveau de l’environnement. Les bibliothèques R au niveau de la session que vous installez via des commandes inline (par exemple install.packages()) ou à partir du dossier Ressources sont par session et par notebook ; elles ne sont pas affectées par les modes de publication d’environnement. Pour plus d’informations, consultez Gérer les bibliothèques dans les environnements Fabric.

Le tableau suivant récapitule les comportements actuels de gestion des bibliothèques R disponibles :

Type de bibliothèque	Installation de l’environnement	Installation au niveau de la session
Flux R (CRAN)	Non pris en charge	Pris en charge
R Personnalisé	Pris en charge	Pris en charge

Conditions préalables

Obtenez un abonnement Microsoft Fabric. Vous pouvez également vous inscrire à un essai gratuit Microsoft Fabric.
Connectez-vous à Microsoft Fabric.
Basculez vers Fabric à l’aide du sélecteur d’expérience situé en bas à gauche de votre page d’accueil.

Bibliothèques R au niveau de la session

Lorsque vous effectuez une analyse interactive des données ou machine learning, vous pouvez essayer des packages plus récents ou avoir besoin de packages actuellement indisponibles sur votre espace de travail. Au lieu de mettre à jour les paramètres de l’espace de travail, utilisez des packages délimités à la session pour ajouter, gérer et mettre à jour les dépendances de session.

Lorsque vous installez des bibliothèques à portée de session, seul le notebook actuel a accès aux bibliothèques spécifiées.
Ces bibliothèques n’affectent pas d’autres sessions ou travaux qui utilisent le même pool Spark.
Ces bibliothèques s’installent en plus des bibliothèques au niveau du runtime de base et du pool.
Les bibliothèques de notebooks sont prioritaires. L'ordre de précédence est : bibliothèques à portée de notebook/session > bibliothèques appliquées à l'environnement > bibliothèques de base du runtime.
Les bibliothèques R délimitées à une session ne sont pas conservées entre les sessions. Ces bibliothèques s’installent au début de chaque session lorsque les commandes d’installation associées sont exécutées.
Les bibliothèques R limitées à la session s’installent automatiquement sur les nœuds de calcul et directeur.

Remarque

Les commandes de gestion des bibliothèques R sont désactivées lors de l’exécution de travaux de pipeline. Si vous souhaitez installer un package dans un pipeline, vous devez utiliser les fonctionnalités de gestion des bibliothèques au niveau de l’espace de travail.

Installer des packages R à partir de CRAN

Vous pouvez facilement installer une bibliothèque R à partir de CRAN.

# install a package from CRAN
install.packages(c("nycflights13", "Lahman"))

Vous pouvez également utiliser des captures instantanées CRAN comme référentiel pour vous assurer de télécharger la même version du package à chaque fois.

# install a package from CRAN snapsho
install.packages("highcharter", repos = "https://cran.microsoft.com/snapshot/2021-07-16/")

Installer des packages R à l’aide de devtools

La bibliothèque devtools simplifie le développement de packages pour accélérer les tâches courantes. Cette bibliothèque est installée dans le runtime Microsoft Fabric par défaut.

Permet devtools de spécifier une version spécifique d’une bibliothèque à installer. Le cluster installe ces bibliothèques sur tous les nœuds.

# Install a specific version. 
install_version("caesar", version = "1.0.0")

De même, vous pouvez installer une bibliothèque directement à partir de GitHub.

# Install a GitHub library. 

install_github("jtilly/matchingR")

Actuellement, les fonctions devtools suivantes sont prises en charge dans Microsoft Fabric :

Commande	Description
install_github()	Installe un package R à partir de GitHub
install_gitlab()	Installe un package R à partir de GitLab
install_bitbucket()	Installe un package R à partir de BitBucket
install_url()	Installe un package R à partir d’une URL arbitraire
install_git()	Installations à partir d’un référentiel Git arbitraire
install_local()	Installations à partir d’un fichier local sur le disque
install_version()	Installations à partir d’une version spécifique sur CRAN

Installer des bibliothèques personnalisées R

Pour utiliser une bibliothèque personnalisée au niveau de la session, chargez-la d’abord dans un Lakehouse attaché.

Ouvrez le bloc-notes dans lequel vous souhaitez utiliser la bibliothèque personnalisée.
Ajoutez un lakehouse à votre bloc-notes.
Sélectionnez la liste déroulante à côté de la lakehouse que vous venez d’ajouter. Ensuite, cliquez avec le bouton droit ou sélectionnez le mot « ... » en regard de Fichiers pour charger votre fichier .tar.gz .
Après avoir chargé le fichier, revenez dans votre notebook. Utilisez la commande suivante pour installer la bibliothèque personnalisée dans votre session :
```
install.packages("filepath/filename.tar.gz", repos = NULL, type = "source")
```

Remarque

Les approches des dossiers d’installation et de ressources inline pour les bibliothèques R sont par session et par notebook. Ils ne sont pas affectés par les modes de publication d'un environnement.

Afficher les bibliothèques installées

Interrogez toutes les bibliothèques installées dans votre session à l’aide de la commande library.

# query all the libraries installed in current session
library()

Utilisez la fonction packageVersion pour vérifier la version de la bibliothèque :

# check the package version
packageVersion("caesar")

Supprimer un package R d’une session

Utilisez la detach fonction pour supprimer une bibliothèque de l’espace de noms. Ces bibliothèques restent sur le disque jusqu’à ce que vous les chargez à nouveau.

# detach a library

detach("package: caesar")

Pour supprimer un package à l’étendue d’une session d’un notebook, utilisez la commande remove.packages(). Cette modification de bibliothèque n’a aucun impact sur d’autres sessions sur le même cluster. Les utilisateurs ne peuvent pas désinstaller ou supprimer des bibliothèques intégrées du runtime de Microsoft Fabric par défaut.

Remarque

Vous ne pouvez pas supprimer de packages principaux tels que SparkR, SparklyR ou R.

remove.packages("caesar")

Bibliothèques R délimitées à une session et SparkR

Des bibliothèques à l’étendue du notebook sont disponibles sur les travailleurs SparkR.

install.packages("stringr")
library(SparkR)

str_length_function <- function(x) {
  library(stringr)
  str_length(x)
}

docs <- c("Wow, I really like the new light sabers!",
               "That book was excellent.",
               "R is a fantastic language.",
               "The service in this restaurant was miserable.",
               "This is neither positive or negative.")

spark.lapply(docs, str_length_function)

Bibliothèques R délimitées à une session et sparklyr

À l’aide spark_apply() de sparklyr, vous pouvez utiliser n’importe quel package R à l’intérieur de Spark. Par défaut, dans sparklyr::spark_apply(), l’argument packages est défini sur FALSE. Ce paramètre copie les bibliothèques dans le répertoire actuel libPaths vers les workers, afin que vous puissiez les importer et les utiliser sur les workers. Par exemple, vous pouvez exécuter la commande suivante pour générer un message chiffré par césar à l’aide de sparklyr::spark_apply() :

install.packages("caesar", repos = "https://cran.microsoft.com/snapshot/2021-07-16/")

spark_version <- sparkR.version()
config <- spark_config()
sc <- spark_connect(master = "yarn", version = spark_version, spark_home = "/opt/spark", config = config)

apply_cases <- function(x) {
  library(caesar)
  caesar("hello world")
}
sdf_len(sc, 5) %>%
  spark_apply(apply_cases, packages=FALSE)

En savoir plus sur les fonctionnalités R :

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2026-03-31

Gestion de bibliothèque R

Modes de publication d’environnement (Rapide vs Complet)

Conditions préalables

Bibliothèques R au niveau de la session

Installer des packages R à partir de CRAN

Installer des packages R à l’aide de devtools

Installer des bibliothèques personnalisées R

Afficher les bibliothèques installées

Supprimer un package R d’une session

Bibliothèques R délimitées à une session et SparkR

Bibliothèques R délimitées à une session et sparklyr

Contenu connexe

Commentaires

Ressources supplémentaires