Configurer un laboratoire pour enseigner R sur Linux

Remarque

Cet article fait référence aux fonctionnalités disponibles dans les plans de labo, qui ont remplacé les comptes de labo.

R est un langage open source utilisé pour le calcul statistique et les graphiques. Il est utilisé à des fins d’analyse statistique, de la génétique à l’analyse des données financières, en passant par le traitement du langage naturel. Le langage R offre une expérience de ligne de commande interactive. RStudio est un environnement de développement intégré (IDE) interactif disponible pour le langage R. La version gratuite fournit des outils d’édition de code, une expérience de débogage intégrée et des outils de développement de package.

Cet article se concentre uniquement sur RStudio et R en tant que bloc de construction pour une classe qui nécessite l’utilisation de l’informatique statistique. Les types de classes Deep Learning et Python et Jupyter Notebooks configurent RStudio différemment. Chaque article explique comment utiliser l’image de la place de marché Science des données machine virtuelle pour Linux (Ubuntu), qui a de nombreux outils liés à la science des données, y compris RStudio, préinstallés.

Configuration du laboratoire

Pour configurer ce labo, vous avez besoin d’un abonnement Azure et d’un plan labo pour commencer. Si vous n’avez pas d’abonnement Azure, créez un compte gratuit avant de commencer.

Configuration de ressource externe

Certaines classes requièrent que des fichiers, tels que des fichiers de données volumineux, soient stockés en externe. Pour plus d’informations sur les options et des instructions d’installation, consultez Utiliser le stockage de fichiers externes dans Azure Lab Services.

Si vous optez pour un R Server partagé pour les étudiants, le serveur doit être configuré avant la création du laboratoire. Pour plus d’informations sur la configuration d’un serveur partagé, consultez Guide pratique pour créer un labo avec une ressource partagée dans Azure Lab Services. Pour obtenir des instructions sur la création d’un RStudio Server, consultez Télécharger RStudio Server pour Debian et Ubuntu et Accès à RStudio Server open source.

Si vous choisissez d’utiliser des ressources externes, vous devez Connecter à votre réseau virtuel dans Azure Lab Services avec votre plan de laboratoire.

Important

La mise en réseau avancée doit être activée lors de la création de votre plan de labo. Elle ne peut pas être ajoutée plus tard.

Paramètres du plan de labo

Une fois que vous disposez d’un abonnement Azure, vous pouvez créer un plan labo dans Azure Lab Services. Pour plus d’informations sur la création d’un plan labo, consultez notre tutoriel consacré à la configuration d’un plan labo. Vous pouvez aussi utiliser un plan de labo existant.

Activez les paramètres de plan de labo comme décrit dans le tableau suivant. Pour plus d’informations sur l’activation des images de la Place de marché Azure, consultez Spécification des images de la Place de marché Azure accessibles aux créateurs d’instances Lab.

Paramètre du plan de labo Instructions
Images de la Place de marché Activez l’image Ubuntu Server 18.04 LTS.

Paramètres du labo

Pour obtenir des instructions sur la création d'un labo, consultez Tutoriel : Configurer un labo. Utilisez les paramètres suivants pour la création du labo.

Paramètre de labo Valeur et description
Taille de la machine virtuelle GPU de petite taille (calcul)
Image de machine virtuelle Ubuntu Server 18.04 LTS
Activer la connexion Bureau à distance Vous ne devez activer ce paramètre que si vous choisissez d’utiliser le protocole RDP. Ce paramètre n’est pas nécessaire si vous choisissez X2Go pour vous connecter à des machines de laboratoire.

Si vous choisissez plutôt d’utiliser RDP, vous devez vous connecter à la machine virtuelle Linux à l’aide de SSH et installer les packages RDP et GUI avant de publier le labo. Ensuite, les étudiants peuvent se connecter à la machine virtuelle Linux à l’aide de RDP ultérieurement. Pour plus d’informations, consultez Utiliser le Bureau à distance graphique pour des machines virtuelles Linux.

Configuration du modèle

Une fois la machine modèle créée, démarrez-la et connectez-vous à celle-ci pour installer R, RStudio Desktop et éventuellement X2Go Server.

Commençons pas mettre à jour apt et mettre à niveau les packages existants sur la machine.

sudo apt update 
sudo apt upgrade

Installer X2Go Server

Si vous choisissez d’utiliser X2Go, installez le serveur. Vous devez d’abord Connecter à une machine virtuelle de laboratoire Linux à l’aide de SSH pour installer le composant serveur. Cela fait, vous pouvez effectuer le reste de la configuration après connexion à l’aide du client X2Go.

L’installation par défaut de X2Go n’est pas compatible avec RStudio. Pour contourner ce problème, mettez à jour le fichier d’options x2goagent.

  1. Modifiez le fichier /etc/x2go/x2goagent.options. N’oubliez pas de modifier le fichier en tant que sudo.

    1. Supprimez le commentaire de la ligne : X2GO_NXAGENT_DEFAULT_OPTIONS+=" -extension GLX"
    2. Commentez la ligne : X2GO_NXAGENT_DEFAULT_OPTIONS+=" -extension GLX"
  2. Redémarrez le serveur X2Go de façon à utiliser les nouvelles options.

    sudo systemctl restart x2goserver
    

Vous pouvez également générer les bibliothèques requises en suivant les instructions de la solution de contournement GLX pour X2Go.

Installer R

Il existe plusieurs façons d’installer R sur la machine virtuelle. Vous installez R à partir du référentiel CRAN (Comprehensive R Archive Network). Il fournit les versions les plus récentes de R. Une fois ce référentiel ajouté à notre ordinateur, vous pouvez installer R et de nombreux autres packages associés.

Nous devons ajouter le référentiel CRAN. Les commandes sont modifiées conformément aux instructions rapides concernant les packages Ubuntu pour R.

#download helper packages
sudo apt install --no-install-recommends software-properties-common dirmngr
# download and add the signing key (by Michael Rutter) for these repos
sudo wget -q "https://cloud.r-project.org/bin/linux/ubuntu/marutter_pubkey.asc" -O /etc/apt/trusted.gpg.d/cran_ubuntu_key.asc
#add repository
sudo add-apt-repository "deb https://cloud.r-project.org/bin/linux/ubuntu bionic-cran40/"

Vous pouvez maintenant installer R en exécutant la commande suivante :

sudo apt install r-base

Installer RStudio

Maintenant que R est installé localement, vous pouvez installer l’environnement de développement intégré (IDE) RStudio. Nous installons la version gratuite de RStudio Desktop. Pour découvrir toutes les versions disponibles, consultez Téléchargements RStudio.

  1. Importez la clé de signature de code pour RStudio.

    sudo gpg --keyserver keyserver.ubuntu.com  --recv-keys 3F32EE77E331692F
    
  2. Téléchargez le fichier Debian Linux Package file (.deb) for R Studio pour Ubuntu. Le fichier est au format rstudio-{version}-amd64.deb. Par exemple :

    export rstudiover="1.4.1717"
    wget --quiet -O rstudio.deb https://download1.rstudio.org/desktop/bionic/amd64/rstudio-$rstudiover-amd64.deb
    
  3. Utilisez gdebi pour installer RStudio. Veillez à utiliser le chemin d’accès au fichier pour indiquer à apt que vous installez un fichier local.

    sudo apt install gdebi-core 
    echo "y" | gdebi rstudio.deb –quiet
    

Packages CRAN

Il est maintenant temps d’installer tous les packages cran souhaités. Commencez par ajouter le référentiel actuel R 4.0 ou ’c2d4u’ ultérieur.

sudo add-apt-repository ppa:c2d4u.team/c2d4u4.0+

Utilisez la commande install.packages(“package name”) dans une session R interactive, comme indiqué dans l’article quick list of useful R packages. Vous pouvez également utiliser l’option de menu Outils -> Installer des packages dans RStudio.

Si vous avez besoin d’aide pour trouver un package, consultez la liste des packages par tâche ou la liste alphabétique des packages.

Coûts

Penchons-nous sur un exemple d’estimation du coût pour ce cours. Supposons que vous ayez une classe de 25 élèves. Chaque élève dispose de 20 heures de cours programmées. Chaque élève dispose également d'un quota de 10 heures pour les devoirs et activités à la maison en dehors des heures de cours programmées. La taille de machine virtuelle que nous avons choisie était GPU de petite taille (calcul), soit 139 unités de laboratoire.

25 étudiants × (20 heures planifiées + 10 heures de quota) × 139 unités Lab × 0,01 USD par heure = 1042,5 USD

Important

L’estimation du coût est fournie à titre d’exemple uniquement. Pour connaître les tarifs actuels, consultez Tarifs Azure Lab Services.

Étapes suivantes

L’image du modèle peut à présent être publiée dans le labo. Pour plus d’informations, consultez Publier le modèle de machine virtuelle.

Au fil de la configuration de votre instance Lab, consultez les articles suivants :