Brug R til Apache Spark
Microsoft Fabric leverer indbygget R-understøttelse af Apache Spark. Dette omfatter understøttelse af SparkR og Sparklyr, som giver brugerne mulighed for at interagere med Spark ved hjælp af velkendte Spark- eller R-grænseflader. Du kan analysere data ved hjælp af R via Spark-batchjobdefinitioner eller med interaktive Microsoft Fabric-notesbøger.
Dette dokument indeholder en oversigt over udvikling af Spark-programmer i Synapse ved hjælp af R-sproget.
Få et Microsoft Fabric-abonnement. Du kan også tilmelde dig en gratis Prøveversion af Microsoft Fabric.
Brug oplevelsesskifteren i venstre side af startsiden til at skifte til Synapse Data Science-oplevelsen.
Microsoft Fabric-notesbog er en webgrænseflade, hvor du kan oprette filer, der indeholder livekode, visualiseringer og fortælletekst. Notesbøger er et godt sted at validere ideer og bruge hurtige eksperimenter til at få indsigt fra dine data. Notesbøger bruges også meget i forbindelse med dataforberedelse, datavisualisering, maskinel indlæring og andre big data-scenarier.
Hvis du vil i gang med R i Microsoft Fabric-notesbøger, skal du ændre det primære sprog øverst i din notesbog ved at angive sprogindstillingen til SparkR (R).
Derudover kan du bruge flere sprog i én notesbog ved at angive kommandoen language magic i starten af en celle.
%%sparkr
# Enter your R code here
Hvis du vil vide mere om notesbøger i Microsoft Fabric Analytics, skal du se Sådan bruger du notesbøger.
Biblioteker indeholder kode, der kan genbruges, og som du måske vil medtage i dine programmer eller projekter. Hvis du vil gøre tredjepartskode eller lokalt bygget kode tilgængelig for dine programmer, kan du installere et bibliotek i et af arbejdsområdet eller notesbogsessionen.
Du kan få mere at vide om, hvordan du administrerer R-biblioteker, under Administration af R-bibliotek.
Microsoft Spark Utilities (MSSparkUtils) er en indbygget pakke, der hjælper dig med nemt at udføre almindelige opgaver. Du kan bruge MSSparkUtils til at arbejde med filsystemer, til at hente miljøvariabler, til at sammenkæde notesbøger og til at arbejde med hemmeligheder. MSSparkUtils understøttes for R-notesbøger.
Du kan komme i gang ved at køre følgende kommandoer:
library(notebookutils)
mssparkutils.fs.help()
Få mere at vide om de understøttede MSSparkUtils-kommandoer under Brug Microsoft Spark Utilities.
SparkR er en R-pakke, der giver en let frontend til brug af Apache Spark fra R. SparkR leverer en distribueret implementering af dataramme, der understøtter handlinger som valg, filtrering, sammenlægning osv. SparkR understøtter også distribueret maskinel indlæring ved hjælp af MLlib.
Du kan få mere at vide om, hvordan du bruger SparkR, ved at gå til Sådan bruger du SparkR.
sparklyr er en R-grænseflade til Apache Spark. Det giver en mekanisme til at interagere med Spark ved hjælp af velkendte R-grænseflader. Du kan bruge sparklyr via Spark-batchjobdefinitioner eller med interaktive Microsoft Fabric-notesbøger.
Hvis du vil vide mere om, hvordan du bruger sparklyr, skal du gå til Sådan bruger du sparklyr.
Tidyverse er en samling R-pakker, som dataforskere ofte bruger i daglige dataanalyser. Den indeholder pakker til dataimport (readr
), datavisualisering (ggplot2
), datamanipulation (dplyr
, tidyr
funktionsprogrammering (purrr
) og modelopbygning (tidymodels
) osv. Pakkerne i tidyverse
er designet til at arbejde problemfrit sammen og følge et ensartet sæt designprincipper. Microsoft Fabric distribuerer den nyeste stabile version af tidyverse
med hver kørselsversion.
Hvis du vil vide mere om, hvordan du bruger Tidyverse, skal du gå til Sådan bruger du Tidyverse.
R-økosystemet tilbyder flere grafbiblioteker, der er pakket med mange forskellige funktioner. Hver Spark-forekomst i Microsoft Fabric indeholder som standard et sæt organiserede og populære biblioteker med åben kildekode. Du kan også tilføje eller administrere ekstra biblioteker eller versioner ved hjælp af funktionerne til administration af Microsoft Fabric-biblioteker.
Få mere at vide om, hvordan du opretter R-visualiseringer ved at gå til R-visualisering.