Einrichten eines Labs zum Unterrichten von R unter Linux

Hinweis

Dieser Artikel bezieht sich auf Features, die in Labkonten verfügbar sind, welche durch Labpläne ersetzt wurden.

R ist eine Open-Source-Sprache, die für statistisches Computing und Grafiken verwendet wird. Sie wird in der statistischen Analyse von Genetik bis hin zur Verarbeitung natürlicher Sprache und Analyse von Finanzdaten verwendet. R bietet als Benutzeroberfläche eine interaktive Befehlszeile. RStudio ist eine interaktive Entwicklungsumgebung (IDE), die für die Sprache R zur Verfügung steht. Die kostenlose Version bietet Codebearbeitungstools, eine integrierte Debugfunktionalität und Paketentwicklungstools.

Dieser Artikel konzentriert sich ausschließlich auf RStudio und R als Baustein für eine Klasse, die die Verwendung statistischer Berechnungen erfordert. Für die Kurstypen Deep Learning sowie Python und Jupyter Notebooks wird RStudio unterschiedlich eingerichtet. In jedem Artikel wird beschrieben, wie Sie das Data Science Virtual Machine for Linux (Ubuntu) -Marketplace-Image verwenden, das viele Data Science-bezogene Tools enthält, einschließlich RStudio, vorinstalliert.

Labkonfiguration

Zum Einrichten dieses Labs benötigen Sie zunächst ein Azure-Abonnement und einen Labplan. Wenn Sie kein Azure-Abonnement besitzen, können Sie ein kostenloses Konto erstellen, bevor Sie beginnen.

Konfiguration externer Ressourcen

Für einige Kurse müssen Dateien, z. B. große Datendateien, extern gespeichert werden. Optionen und Setupanweisungen finden Sie unter Verwenden von externem Dateispeicher in Azure Lab Services.

Wenn Sie sich für eine R Server-Freigabe für die Kursteilnehmer entscheiden, muss der Server eingerichtet werden, bevor das Lab erstellt wird. Weitere Informationen zum Einrichten eines freigegebenen Servers finden Sie unter Erstellen eines Labs mit einer freigegebenen Ressource in Azure Lab Services. Anweisungen zum Erstellen eines RStudio-Servers finden Sie unter Herunterladen von RStudio Server für Debian und Ubuntu und Zugreifen auf RStudio Server (Open-Source).

Wenn Sie externe Ressourcen verwenden möchten, müssen Sie ihr virtuelles Netzwerk in Azure Lab Services mit Ihrem Laborplan Verbinden.

Wichtig

Erweiterte Netzwerke müssen während der Erstellung Ihres Laborplans aktiviert werden. Sie können nicht später hinzugefügt werden.

Einstellungen für Labpläne

Sobald Sie ein Azure-Abonnement erhalten, können Sie ein neues Lab-Konto in Azure Lab Services erstellen. Weitere Informationen zum Erstellen eines neuen Labplans finden Sie im Tutorial zum Einrichten eines Labplans. Sie können auch einen vorhandenen Labplan verwenden.

Aktivieren Sie die Einstellungen Ihres Lab-Plans wie in der folgenden Tabelle beschrieben. Weitere Informationen zum Aktivieren von Azure Marketplace-Images finden Sie unter Angeben der für Lab-Ersteller verfügbaren Azure Marketplace-Images.

Einstellung für Labplan Anweisungen
Marketplace-Images Aktivieren Sie das Image Ubuntu Server 18.04 LTS.

Labeinstellungen

Anweisungen zum Erstellen eines Labs finden Sie unter Tutorial: Einrichten eines Labs. Verwenden Sie beim Erstellen des Labs die folgenden Einstellungen:

Lab-Einrichtung Wert und Beschreibung
Größe des virtuellen Computers Kleine GPU (Compute)
VM-Image Ubuntu Server 18.04 LTS
Remotedesktopverbindung aktivieren Diese Einstellung muss aktiviert werden, wenn Sie RDP verwenden möchten. Diese Einstellung ist nicht erforderlich, wenn Sie X2Go zum Herstellen einer Verbindung mit den Lab-Computern auswählen.

Wenn Sie stattdessen RDP verwenden, müssen Sie eine Verbindung mit der Linux-VM mithilfe von SSH herstellen und die RDP- und GUI-Pakete installieren, bevor Sie das Lab veröffentlichen. Dann können Ihre Kursteilnehmer später mithilfe von RDP eine Verbindung mit der Linux-VM herstellen. Weitere Informationen finden Sie unter Aktivieren eines Remotedesktops mit GUI für Linux-VMs.

Vorlagenkonfiguration

Nachdem Sie den Vorlagencomputer erstellt haben, starten Sie ihn, und stellen Sie eine Verbindung mit ihm her, um R, RStudio Desktop und optional X2Go Server zu installieren.

Zunächst aktualisieren wir apt und führen ein Upgrade für die vorhandenen Pakete auf dem Computer durch.

sudo apt update 
sudo apt upgrade

Installieren von X2Go Server

Wenn Sie sich für die Verwendung von X2Go entscheiden, installieren Sie den Server. Sie müssen zunächst einen virtuellen Linux-Laborcomputer mit SSH Verbinden, um die Serverkomponente zu installieren. Wenn dieser Vorgang abgeschlossen ist, kann der Rest des Setups durchgeführt werden, sobald Sie eine Verbindung über den X2Go-Client hergestellt haben.

Die Standardinstallation von X2Go ist nicht mit RStudio kompatibel. Um dieses Problem zu umgehen, aktualisieren Sie die x2goagent-Optionsdatei.

  1. Bearbeiten Sie die Datei /etc/x2go/x2goagent.options. Denken Sie daran, die Datei als sudo zu bearbeiten.

    1. Heben Sie die Auskommentierung der folgenden Zeile auf: X2GO_NXAGENT_DEFAULT_OPTIONS+=" -extension GLX"
    2. Kommentieren Sie die folgenden Zeile aus: X2GO_NXAGENT_DEFAULT_OPTIONS+=" -extension GLX"
  2. Starten Sie X2Go Server neu, damit die neuen Optionen verwendet werden.

    sudo systemctl restart x2goserver
    

Alternativ können Sie die erforderlichen Bibliotheken erstellen, indem Sie anweisungen zur GLX-Problemumgehung für X2Go befolgen.

Installieren von R

Für die Installation von R auf der VM gibt es verschiedene Möglichkeiten. Sie installieren R aus dem Repository "Comprehensive R Archive Network (CRAN)". Es bietet die aktuellsten Versionen von R. Sobald dieses Repository zu unserem Computer hinzugefügt wurde, können Sie R und viele andere verwandte Pakete installieren.

Fügen wir das CRAN-Repository hinzu. Die Befehle wurden anhand der Anweisungen geändert, die unter Ubuntu-Pakete für R – Kurzanleitungen verfügbar sind.

#download helper packages
sudo apt install --no-install-recommends software-properties-common dirmngr
# download and add the signing key (by Michael Rutter) for these repos
sudo wget -q "https://cloud.r-project.org/bin/linux/ubuntu/marutter_pubkey.asc" -O /etc/apt/trusted.gpg.d/cran_ubuntu_key.asc
#add repository
sudo add-apt-repository "deb https://cloud.r-project.org/bin/linux/ubuntu bionic-cran40/"

Jetzt können wir das SDK mithilfe des folgenden Befehls installieren:

sudo apt install r-base

Installieren von RStudio

Nachdem Sie R lokal installiert haben, können Sie die RStudio-IDE installieren. Wir installieren die kostenlose Version von RStudio Desktop. Alle verfügbaren Versionen finden Sie unter RStudio-Downloads.

  1. Importieren Sie den Codesignaturschlüssel für RStudio.

    sudo gpg --keyserver keyserver.ubuntu.com  --recv-keys 3F32EE77E331692F
    
  2. Laden Sie die Debian Linux-Paketdatei (DEB) für R Studio für Ubuntu herunter. Die Datei befindet sich im Format rstudio-{version}-amd64.deb. Beispiel:

    export rstudiover="1.4.1717"
    wget --quiet -O rstudio.deb https://download1.rstudio.org/desktop/bionic/amd64/rstudio-$rstudiover-amd64.deb
    
  3. Verwenden Sie gdebi, um RStudio zu installieren. Stellen Sie sicher, dass Sie den Dateipfad verwenden, um für apt die Installation einer lokalen Datei anzugeben.

    sudo apt install gdebi-core 
    echo "y" | gdebi rstudio.deb –quiet
    

CRAN-Pakete

Jetzt ist der Zeitpunkt für die Installation der gewünschten CRAN-Pakete. Fügen Sie zuerst das aktuelle c2d4u-Repository für R 4.0 oder höher hinzu.

sudo add-apt-repository ppa:c2d4u.team/c2d4u4.0+

Verwenden Sie den Befehl install.packages(“package name”) in einer interaktiven R-Sitzung, wie im Artikel Schnellliste mit nützlichen R-Paketen gezeigt. Verwenden Sie alternativ das Menüelement „Tools“ > „Install Packages“ (Extras > Pakete installieren) in RStudio.

Wenn Sie bei der Suche nach einem Paket Hilfe benötigen, sehen Sie sich eine Liste von Paketen nach Aufgabe oder eine alphabetische Liste der Pakete an.

„Cost“ (Kosten)

Sehen wir uns eine Beispielkostenschätzung für diesen Kurs an. Angenommen, Sie haben einen Kurs mit 25 Kursteilnehmern. Für jeden Kursteilnehmer ist eine Kurszeit von 20 Stunden geplant. Zudem erhält jeder Kursteilnehmer ein Kontingent von zehn zusätzlichen Stunden für Hausaufgaben und Arbeitsaufträge außerhalb der geplanten Kurszeit. Als VM-Größe wurde Kleine GPU (Compute) ausgewählt, was 139 Lab-Einheiten entspricht.

25 Kursteilnehmer × (20 geplante Stunden + 10 Kontingentstunden) × 139 Lab-Einheiten × 0,01 USD pro Stunde = 1042,5 USD

Wichtig

Diese Kostenschätzung dient ausschließlich zu Beispielzwecken. Aktuelle Informationen zu Preisen finden Sie unter Azure Lab Services – Preise.

Nächste Schritte

Das Vorlagenimage kann jetzt im Lab veröffentlicht werden. Weitere Informationen finden Sie unter Veröffentlichen der Vorlagen-VM.

Lesen Sie folgende Artikel zum Einrichten des Labs: