Freigeben über


Verwenden von R für Apache Spark

Microsoft Fabric bietet integrierte R-Unterstützung für Apache Spark. Dies umfasst Unterstützung für SparkR- und sparklyr-, mit denen Benutzer mithilfe vertrauter Spark- oder R-Schnittstellen mit Spark interagieren können. Sie können Daten mithilfe von R über Spark Batchauftragsdefinitionen oder mit interaktiven Microsoft Fabric-Notizbüchern analysieren.

Dieses Dokument bietet eine Übersicht über die Entwicklung von Spark-Anwendungen in Synapse mit der Sprache R.

Voraussetzungen

Erstellen und Ausführen von Notebooksitzungen

Microsoft Fabric-Notizbuch ist eine Weboberfläche, über die Sie Dateien erstellen können, die Livecode, Visualisierungen und Narrativentext enthalten. Notizbücher sind ein guter Ort, um Ideen zu validieren und schnelle Experimente zu verwenden, um Einblicke aus Ihren Daten zu erhalten. Notizbücher werden auch häufig in der Datenvorbereitung, Datenvisualisierung, maschinellem Lernen und anderen Big Data-Szenarien verwendet.

Um mit R in Microsoft Fabric-Notizbüchern zu beginnen, ändern Sie die primäre Sprache oben im Notizbuch, indem Sie die Sprachoption auf SparkR (R)festlegen.

Darüber hinaus können Sie mehrere Sprachen in einem Notizbuch verwenden, indem Sie den Sprachzauberbefehl am Anfang einer Zelle angeben.

%%sparkr
# Enter your R code here

Weitere Informationen zu Notizbüchern in Microsoft Fabric Analytics finden Sie unter Verwenden von Notizbüchern.

Installieren von Paketen

Bibliotheken stellen wiederverwendbaren Code bereit, den Sie möglicherweise in Ihre Programme oder Projekte einbeziehen möchten. Um Drittanbieter- oder lokal erstellten Code für Ihre Anwendungen verfügbar zu machen, können Sie eine Bibliothek in einer Ihrer Arbeitsbereichs- oder Notizbuch-Sitzung installieren.

Weitere Informationen zum Verwalten von R-Bibliotheken finden Sie unter R-Bibliotheksverwaltung.

Notebook-Dienstprogramme

Microsoft Spark Utilities (MSSparkUtils) ist ein integriertes Paket, das Ihnen bei der einfachen Ausführung allgemeiner Aufgaben hilft. Sie können MSSparkUtils verwenden, um mit Dateisystemen zu arbeiten, Umgebungsvariablen abzurufen, Notizbücher miteinander zu verketten und mit geheimen Schlüsseln zu arbeiten. MSSparkUtils wird für R-Notizbücher unterstützt.

Um zu beginnen, können Sie die folgenden Befehle ausführen:

library(notebookutils)
mssparkutils.fs.help()

Erfahren Sie mehr über die unterstützten MSSparkUtils-Befehle unter Verwenden von Microsoft Spark Utilities.

Verwenden von SparkR

SparkR ist ein R-Paket, das ein leichtes Frontend zur Verwendung von Apache Spark von R. SparkR bietet eine verteilte Datenframeimplementierung, die Vorgänge wie Auswahl, Filterung, Aggregation usw. unterstützt. SparkR unterstützt auch verteiltes maschinelles Lernen mithilfe von MLlib.

Weitere Informationen zur Verwendung von SparkR finden Sie unter Verwenden von SparkR.

Verwenden von Sparklyr

sparklyr ist eine R-Schnittstelle zu Apache Spark. Es bietet einen Mechanismus für die Interaktion mit Spark mithilfe vertrauter R-Schnittstellen. Sie können Sparklyr über Spark-Batch-Auftragsdefinitionen oder mit interaktiven Microsoft Fabric-Notizbüchern verwenden.

Weitere Informationen zur Verwendung von Sparklyr finden Sie unter Verwenden von Sparklyr.

Verwenden von "Tidyverse"

Tidyverse ist eine Sammlung von R-Paketen, die Data Scientists häufig in alltäglichen Datenanalysen verwenden. Es enthält Pakete für den Datenimport (readr), Datenvisualisierung (ggplot2), Datenmanipulation (dplyr, tidyr), funktionale Programmierung (purrr) und Modellerstellung (tidymodels) usw. Die Pakete in tidyverse sind darauf ausgelegt, nahtlos zusammenzuarbeiten und einen konsistenten Satz von Designprinzipien zu befolgen. Microsoft Fabric verteilt die neueste stabile Version von tidyverse mit jeder Laufzeitversion.

Weitere Informationen zur Verwendung von Tidyverse finden Sie unter Verwenden von Tidyverse.

R-Visualisierung

Das R-Ökosystem bietet mehrere Graphingbibliotheken, die mit vielen verschiedenen Features verpackt sind. Standardmäßig enthält jede Spark-Instanz in Microsoft Fabric eine Reihe kuratierter und beliebter Open-Source-Bibliotheken. Sie können auch zusätzliche Bibliotheken oder Versionen hinzufügen oder verwalten, indem Sie die Verwaltungsfunktionen von Microsoft Fabric Bibliothekverwenden.

Erfahren Sie mehr darüber, wie Sie R-Visualisierungen erstellen, indem Sie R-Visualisierungbesuchen.