R gebruiken voor Apache Spark
Microsoft Fabric biedt ingebouwde R-ondersteuning voor Apache Spark. Dit omvat ondersteuning voor SparkR en sparklyr, waarmee gebruikers kunnen communiceren met Spark met behulp van vertrouwde Spark- of R-interfaces. U kunt gegevens analyseren met behulp van R via Spark-batchtaakdefinities of met interactieve Microsoft Fabric-notebooks.
Dit document biedt een overzicht van het ontwikkelen van Spark-toepassingen in Synapse met behulp van de R-taal.
Haal een Microsoft Fabric-abonnement op. Of meld u aan voor een gratis proefversie van Microsoft Fabric.
Meld u aan bij Microsoft Fabric.
Gebruik de ervaringswisselaar aan de linkerkant van de startpagina om over te schakelen naar de Synapse-Datawetenschap-ervaring.
Microsoft Fabric-notebook is een webinterface waarmee u bestanden kunt maken die livecode, visualisaties en verhaaltekst bevatten. Notebooks zijn een goede plek om ideeën te valideren en snelle experimenten te gebruiken om inzichten uit uw gegevens te verkrijgen. Notebooks worden ook veel gebruikt in gegevensvoorbereiding, gegevensvisualisatie, machine learning en andere big data-scenario's.
Als u aan de slag wilt gaan met R in Microsoft Fabric-notebooks, wijzigt u de primaire taal boven aan uw notebook door de taaloptie in te stellen op SparkR (R).
Daarnaast kunt u meerdere talen in één notebook gebruiken door de magic-opdracht taal aan het begin van een cel op te geven.
%%sparkr
# Enter your R code here
Zie Notebooks gebruiken voor meer informatie over notebooks in Microsoft Fabric Analytics.
Bibliotheken bieden herbruikbare code die u mogelijk wilt opnemen in uw programma's of projecten. Als u externe of lokaal gebouwde code beschikbaar wilt maken voor uw toepassingen, kunt u een bibliotheek installeren op een van uw werkruimte of notebooksessie.
Zie R-bibliotheekbeheer voor meer informatie over het beheren van R-bibliotheken.
Microsoft Spark Utilities (MSSparkUtils) is een ingebouwd pakket om u te helpen eenvoudig algemene taken uit te voeren. U kunt MSSparkUtils gebruiken om te werken met bestandssystemen, om omgevingsvariabelen op te halen, notebooks te koppelen en met geheimen te werken. MSSparkUtils wordt ondersteund voor R-notebooks.
U kunt de volgende opdrachten uitvoeren om aan de slag te gaan:
library(notebookutils)
mssparkutils.fs.help()
Meer informatie over de ondersteunde MSSparkUtils-opdrachten vindt u in Microsoft Spark Utilities gebruiken.
SparkR is een R-pakket dat een lichtgewicht front-end biedt voor het gebruik van Apache Spark van R. SparkR biedt een gedistribueerde implementatie van een gegevensframe die ondersteuning biedt voor bewerkingen zoals selectie, filteren, aggregatie, enzovoort. SparkR biedt ook ondersteuning voor gedistribueerde machine learning met MLlib.
U vindt meer informatie over het gebruik van SparkR door naar SparkR te gaan.
sparklyr is een R-interface voor Apache Spark. Het biedt een mechanisme voor interactie met Spark met behulp van vertrouwde R-interfaces. U kunt sparklyr gebruiken via Spark Batch-taakdefinities of met interactieve Microsoft Fabric-notebooks.
Ga naar Sparklyr gebruiken voor meer informatie over het gebruik van sparklyr.
Tidyverse is een verzameling R-pakketten die gegevenswetenschappers vaak gebruiken in dagelijkse gegevensanalyses. Het bevat pakketten voor het importeren van gegevens (readr
), gegevensvisualisatie (ggplot2
), gegevensmanipulatie (dplyr
, tidyr
functionele programmering (purrr
) en modelbouw (tidymodels
) enzovoort. De pakketten in tidyverse
zijn ontworpen om naadloos samen te werken en een consistente set ontwerpprincipes te volgen. Microsoft Fabric distribueert de nieuwste stabiele versie van tidyverse
elke runtimerelease.
Ga naar Tidyverse gebruiken voor meer informatie over het gebruik van Tidyverse.
Het R-ecosysteem biedt meerdere grafiekbibliotheken die zijn verpakt met veel verschillende functies. Standaard bevat elk Spark-exemplaar in Microsoft Fabric een set gecureerde en populaire opensource-bibliotheken. U kunt ook extra bibliotheken of versies toevoegen of beheren met behulp van de microsoft Fabric-bibliotheekbeheermogelijkheden.
Meer informatie over het maken van R-visualisaties vindt u in R-visualisaties.