Lezen in het Engels

Delen via


R gebruiken voor Apache Spark

Microsoft Fabric biedt ingebouwde R-ondersteuning voor Apache Spark. Dit omvat ondersteuning voor SparkR en sparklyr, waarmee gebruikers kunnen communiceren met Spark met behulp van vertrouwde Spark- of R-interfaces. U kunt gegevens analyseren met behulp van R via Spark-batchtaakdefinities of met interactieve Microsoft Fabric-notebooks.

Dit document biedt een overzicht van het ontwikkelen van Spark-toepassingen in Synapse met behulp van de R-taal.

Vereisten

Notebooksessies maken en uitvoeren

Microsoft Fabric-notebook is een webinterface waarmee u bestanden kunt maken die livecode, visualisaties en verhaaltekst bevatten. Notebooks zijn een goede plek om ideeën te valideren en snelle experimenten te gebruiken om inzichten uit uw gegevens te verkrijgen. Notebooks worden ook veel gebruikt in gegevensvoorbereiding, gegevensvisualisatie, machine learning en andere big data-scenario's.

Als u aan de slag wilt gaan met R in Microsoft Fabric-notebooks, wijzigt u de primaire taal boven aan uw notebook door de taaloptie in te stellen op SparkR (R).

Daarnaast kunt u meerdere talen in één notebook gebruiken door de magic-opdracht taal aan het begin van een cel op te geven.

%%sparkr
# Enter your R code here

Zie Notebooks gebruiken voor meer informatie over notebooks in Microsoft Fabric Analytics.

Pakketten installeren

Bibliotheken bieden herbruikbare code die u mogelijk wilt opnemen in uw programma's of projecten. Als u externe of lokaal gebouwde code beschikbaar wilt maken voor uw toepassingen, kunt u een bibliotheek installeren op een van uw werkruimte of notebooksessie.

Zie R-bibliotheekbeheer voor meer informatie over het beheren van R-bibliotheken.

Hulpprogramma's voor notitieblokken

Microsoft Spark Utilities (MSSparkUtils) is een ingebouwd pakket om u te helpen eenvoudig algemene taken uit te voeren. U kunt MSSparkUtils gebruiken om te werken met bestandssystemen, om omgevingsvariabelen op te halen, notebooks te koppelen en met geheimen te werken. MSSparkUtils wordt ondersteund voor R-notebooks.

U kunt de volgende opdrachten uitvoeren om aan de slag te gaan:

library(notebookutils)
mssparkutils.fs.help()

Meer informatie over de ondersteunde MSSparkUtils-opdrachten vindt u in Microsoft Spark Utilities gebruiken.

SparkR gebruiken

SparkR is een R-pakket dat een lichtgewicht front-end biedt voor het gebruik van Apache Spark van R. SparkR biedt een gedistribueerde implementatie van een gegevensframe die ondersteuning biedt voor bewerkingen zoals selectie, filteren, aggregatie, enzovoort. SparkR biedt ook ondersteuning voor gedistribueerde machine learning met MLlib.

U vindt meer informatie over het gebruik van SparkR door naar SparkR te gaan.

Sparklyr gebruiken

sparklyr is een R-interface voor Apache Spark. Het biedt een mechanisme voor interactie met Spark met behulp van vertrouwde R-interfaces. U kunt sparklyr gebruiken via Spark Batch-taakdefinities of met interactieve Microsoft Fabric-notebooks.

Ga naar Sparklyr gebruiken voor meer informatie over het gebruik van sparklyr.

Tidyverse gebruiken

Tidyverse is een verzameling R-pakketten die gegevenswetenschappers vaak gebruiken in dagelijkse gegevensanalyses. Het bevat pakketten voor het importeren van gegevens (readr), gegevensvisualisatie (ggplot2), gegevensmanipulatie (dplyr, tidyrfunctionele programmering (purrr) en modelbouw (tidymodels) enzovoort. De pakketten in tidyverse zijn ontworpen om naadloos samen te werken en een consistente set ontwerpprincipes te volgen. Microsoft Fabric distribueert de nieuwste stabiele versie van tidyverse elke runtimerelease.

Ga naar Tidyverse gebruiken voor meer informatie over het gebruik van Tidyverse.

R-visualisatie

Het R-ecosysteem biedt meerdere grafiekbibliotheken die zijn verpakt met veel verschillende functies. Standaard bevat elk Spark-exemplaar in Microsoft Fabric een set gecureerde en populaire opensource-bibliotheken. U kunt ook extra bibliotheken of versies toevoegen of beheren met behulp van de microsoft Fabric-bibliotheekbeheermogelijkheden.

Meer informatie over het maken van R-visualisaties vindt u in R-visualisaties.