R Language Modules

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

In diesem Artikel werden die Module in Machine Learning Studio (klassisch) aufgeführt, die die Ausführung von R-Code unterstützen. Diese Module erleichtern es, R-Modelle in der Produktion zu veröffentlichen und die Erfahrung der R-Sprach-Community zu nutzen, um reale Probleme zu lösen.

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

Dieser Artikel beschreibt auch einige allgemeine Anforderungen für die Verwendung von R in Machine Language Studio (klassisch) und listet bekannte Probleme und Tipps auf.

Liste der Module

Die Kategorie R-Sprachmodule umfasst die folgenden Module:

Anforderungen bei Verwendung von R

Bevor Sie R-Skript in Machine Learning Studio (klassisch) verwenden, beachten Sie die folgenden Anforderungen:

  • Wenn Sie Daten importiert haben, die CSV oder andere Formate verwenden, können Sie die Daten nicht direkt im CSV-Format aus Ihrem R-Code lesen. Verwenden Sie stattdessen In Dataset konvertieren , um die Daten vorzubereiten, bevor Sie sie als Eingabe für ein R-Modul verwenden.

  • Wenn Sie ein Machine Learning-Dataset als Eingabe an ein R-Modul anfügen, wird das Dataset automatisch als Datenrahmen mit dem Variablennamen-Dataset in den R-Arbeitsbereich geladen.

    Sie können jedoch zusätzliche Datenrahmen definieren oder den Namen der Standard-Datasetvariablen in Ihrem R-Skript ändern.

  • Die R-Module werden in einer geschützten und isolierten Umgebung in Ihrem privaten Arbeitsbereich ausgeführt. Sie können innerhalb Ihres Arbeitsbereichs Datenrahmen und Variablen für die Verwendung in mehreren Modulen erstellen.

    Sie können jedoch keine R-Datenrahmen aus einem anderen Arbeitsbereich laden oder Variablen lesen, die in einem anderen Arbeitsbereich erstellt wurden, auch wenn dieser Arbeitsbereich in einer Azure-Sitzung geöffnet ist. Außerdem können Sie keine Module verwenden, die über eine Java-Abhängigkeit verfügen oder direkten Netzwerkzugriff erfordern.

Optimierung für R-Bewertungsaufgaben

Die Implementierung von R in der Machine Learning Studio (klassisch) und Arbeitsbereichsumgebung umfasst zwei Hauptkomponenten. Eine Komponente koordiniert die Skriptausführung, die andere ermöglicht den schnellen Datenzugriff und die Bewertung. Die Bewertungskomponente ist optimiert, um die Skalierbarkeit und Leistung zu verbessern.

Daher unterstützen R-Arbeitsbereiche in Machine Learning Studio (klassisch) auch zwei Arten von Bewertungsaufgaben, die jeweils für unterschiedliche Anforderungen optimiert sind. In der Regel verwenden Sie die Bewertung dateispezifischen, wenn Sie ein Experiment erstellen. In der Regel verwenden Sie den Anforderungsantwortdienst (Request Response Service, RRS) für eine sehr schnelle Bewertung, wenn Sie die Bewertung als Teil eines Webdiensts verwenden.

Unterstützung von R-Paketen und -Versionen

Machine Learning Studio (klassisch) enthält über 500 der beliebtesten R-Pakete. Welche R-Pakete Sie auswählen können, hängt davon ab, welche R-Version Sie für Ihr Experiment auswählen:

  • CRAN R
  • Microsoft R Open (MRO 3.2.2 oder MRO 3.4.4)

Wenn Sie ein Experiment erstellen, müssen Sie für alle Module in Ihrem Experiment eine einzelne R-Version auswählen, die ausgeführt werden soll.

Liste der Pakete pro Version

Eine Liste der Pakete, die derzeit in Machine Learning unterstützt werden, finden Sie unter Von Machine Learning.

Sie können den folgenden Code auch einem Execute R Script-Modul in Ihrem Experiment hinzufügen und ausführen, um ein Dataset mit Paketnamen und -versionen zu erhalten. Achten Sie darauf, dass Sie die R-Version in den Moduleigenschaften festlegen, um die richtige Liste für Ihre beabsichtigte Umgebung zu generieren.

data.set <- data.frame(installed.packages())
maml.mapOutputPort("data.set")

Wichtig

Die Pakete, die in Machine Language Studio (klassisch) unterstützt werden, ändern sich häufig. Wenn Sie bedenken, ob ein R-Paket unterstützt wird, verwenden Sie das bereitgestellte R-Codebeispiel, um die vollständige Liste der Pakete in der aktuellen Umgebung zu erhalten.

Erweitern von Experimenten mithilfe der Sprache R

Es gibt viele Möglichkeiten, mit denen Sie Ihr Experiment durch benutzerdefinierte R-Skripts oder durch Hinzufügen von R-Paketen erweitern können. Hier sind einige Ideen für den Einstieg:

  • Verwenden Sie R-Code, um benutzerdefinierte mathematische Operationen durchzuführen. Es gibt z. B. R-Pakete zum Lösen von Differentialgleichungen, Generieren von Zufallszahlen oder Ausführen von Monte Carlo-Simulationen.

  • Wenden Sie benutzerdefinierte Transformationen für Daten an. Beispielsweise können Sie ein R-Paket verwenden, um Interpolation für Zeitreihendaten durchzuführen oder linguistische Analysen durchzuführen.

  • Arbeiten mit verschiedenen Datenquellen. Die R-Skriptmodule unterstützen einen zusätzlichen Satz von Eingaben, die Datendateien enthalten können, im ZIP-Format. Sie können ZIP-Datendateien zusammen mit R-Paketen verwenden, die für solche Datenquellen entwickelt wurden, um hierarchische Daten in einer flachen Datentabelle zu flatten. Sie können diese auch verwenden, um Daten aus Excel und anderen Dateiformaten zu lesen.

  • Verwenden Sie benutzerdefinierte Metriken für die Auswertung. Anstatt beispielsweise die in Evaluate bereitgestellten Funktionen zu verwenden, können Sie ein R-Paket importieren und dann seine Metriken anwenden.

Im folgenden Beispiel wird der allgemeine Prozess veranschaulicht, wie Sie neue Pakete installieren und benutzerdefinierten R-Code in Ihrem Experiment verwenden können.

Teilen von Spalten mithilfe von R

Mitunter müssen die Daten umfassend bearbeitet werden, um Merkmale zu extrahieren. Angenommen, Sie verfügen über eine Textdatei, die eine ID gefolgt von Werten und Notizen enthält, die alle durch Leerzeichen getrennt sind. Angenommen, Ihre Textdatei enthält Zeichen, die von Machine Language Studio (klassisch) nicht unterstützt werden.

Es gibt mehrere R-Pakete, die spezielle Funktionen für solche Aufgaben bereitstellen. Das splitstackshape-Bibliothekspaket enthält mehrere nützliche Funktionen zum Aufteilen mehrerer Spalten, auch wenn jede Spalte ein anderes Trennzeichen hat.

Im folgenden Beispiel wird veranschaulicht, wie die erforderlichen Pakete installiert und Spalten aufgeteilt werden. Sie würden diesen Code dem Modul Execute R Script hinzufügen.

#install dependent packages  
install.packages("src/concat.split.multiple/data.table_1.9.2.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.data.table <- library("data.table", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
install.packages("src/concat.split.multiple/plyr_1.8.1.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.plyr <- library("plyr", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
install.packages("src/concat.split.multiple/Rcpp_0.11.2.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.Rcpp <- library("Rcpp", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
install.packages("src/concat.split.multiple/reshape2_1.4.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.reshape2 <- library("reshape2", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
#install actual packages  
install.packages("src/concat.split.multiple/splitstackshape_1.2.0.zip", lib=".", repos = NULL, verbose = TRUE)  
(success.splitstackshape <- library("splitstackshape", lib.loc = ".", logical.return = TRUE, verbose = TRUE))  
  
#Load installed library  
library(splitstackshape)  
  
#Use library method to split & concat  
data <- concat.split.multiple(maml.mapInputPort(1), c("TermsAcceptedUserClientIPAddress", "EmailAddress"), c(".", "@"))  
  
#Print column names to console  
colnames(data)  
  
#Redirect data to output port  
maml.mapOutputPort("data")  

Zusätzliche Ressourcen

Beginnen Sie mit diesem Tutorial, in dem beschrieben wird, wie Sie ein benutzerdefiniertes R-Modul erstellen:

In diesem Artikel werden die Unterschiede zwischen den beiden Bewertungs-Engines ausführlich erläutert. Außerdem wird erläutert, wie Sie eine Bewertungsmethode auswählen können, wenn Sie Ihr Experiment als Webdienst bereitstellen:

Dieses Experiment in der Azure KI-Katalog veranschaulicht, wie Sie ein benutzerdefiniertes R-Modul erstellen können, das Training, Bewertung und Auswertung übernimmt:

In diesem Artikel, der auf R-Gegens veröffentlicht wurde, wird veranschaulicht, wie Sie ihre eigene Auswertungsmethode in Machine Learning:

Weitere Hilfe zu R

Diese Website enthält eine kategorisierte Liste von Paketen, die Sie nach Schlüsselwörtern durchsuchen können:

Zusätzliche R-Codebeispiele und Hilfe zu R und den zugehörigen Anwendungen finden Sie in folgenden Ressourcen:

Siehe auch