Læs på engelsk

Del via


Brug R til Apache Spark

Microsoft Fabric leverer indbygget R-understøttelse af Apache Spark. Dette omfatter understøttelse af SparkR og Sparklyr, som giver brugerne mulighed for at interagere med Spark ved hjælp af velkendte Spark- eller R-grænseflader. Du kan analysere data ved hjælp af R via Spark-batchjobdefinitioner eller med interaktive Microsoft Fabric-notesbøger.

Dette dokument indeholder en oversigt over udvikling af Spark-programmer i Synapse ved hjælp af R-sproget.

Forudsætninger

  • Få et Microsoft Fabric-abonnement. Du kan også tilmelde dig en gratis Prøveversion af Microsoft Fabric.

  • Log på Microsoft Fabric.

  • Brug oplevelsesskifteren i venstre side af startsiden til at skifte til Synapse Data Science-oplevelsen.

    Screenshot of the experience switcher menu, showing where to select Data Science.

Opret og kør notesbogsessioner

Microsoft Fabric-notesbog er en webgrænseflade, hvor du kan oprette filer, der indeholder livekode, visualiseringer og fortælletekst. Notesbøger er et godt sted at validere ideer og bruge hurtige eksperimenter til at få indsigt fra dine data. Notesbøger bruges også meget i forbindelse med dataforberedelse, datavisualisering, maskinel indlæring og andre big data-scenarier.

Hvis du vil i gang med R i Microsoft Fabric-notesbøger, skal du ændre det primære sprog øverst i din notesbog ved at angive sprogindstillingen til SparkR (R).

Derudover kan du bruge flere sprog i én notesbog ved at angive kommandoen language magic i starten af en celle.

%%sparkr
# Enter your R code here

Hvis du vil vide mere om notesbøger i Microsoft Fabric Analytics, skal du se Sådan bruger du notesbøger.

Installér pakker

Biblioteker indeholder kode, der kan genbruges, og som du måske vil medtage i dine programmer eller projekter. Hvis du vil gøre tredjepartskode eller lokalt bygget kode tilgængelig for dine programmer, kan du installere et bibliotek i et af arbejdsområdet eller notesbogsessionen.

Du kan få mere at vide om, hvordan du administrerer R-biblioteker, under Administration af R-bibliotek.

Hjælpeprogrammer til notesbøger

Microsoft Spark Utilities (MSSparkUtils) er en indbygget pakke, der hjælper dig med nemt at udføre almindelige opgaver. Du kan bruge MSSparkUtils til at arbejde med filsystemer, til at hente miljøvariabler, til at sammenkæde notesbøger og til at arbejde med hemmeligheder. MSSparkUtils understøttes for R-notesbøger.

Du kan komme i gang ved at køre følgende kommandoer:

library(notebookutils)
mssparkutils.fs.help()

Få mere at vide om de understøttede MSSparkUtils-kommandoer under Brug Microsoft Spark Utilities.

Brug SparkR

SparkR er en R-pakke, der giver en let frontend til brug af Apache Spark fra R. SparkR leverer en distribueret implementering af dataramme, der understøtter handlinger som valg, filtrering, sammenlægning osv. SparkR understøtter også distribueret maskinel indlæring ved hjælp af MLlib.

Du kan få mere at vide om, hvordan du bruger SparkR, ved at gå til Sådan bruger du SparkR.

Brug sparklyr

sparklyr er en R-grænseflade til Apache Spark. Det giver en mekanisme til at interagere med Spark ved hjælp af velkendte R-grænseflader. Du kan bruge sparklyr via Spark-batchjobdefinitioner eller med interaktive Microsoft Fabric-notesbøger.

Hvis du vil vide mere om, hvordan du bruger sparklyr, skal du gå til Sådan bruger du sparklyr.

Brug Tidyverse

Tidyverse er en samling R-pakker, som dataforskere ofte bruger i daglige dataanalyser. Den indeholder pakker til dataimport (readr), datavisualisering (ggplot2), datamanipulation (dplyr, tidyrfunktionsprogrammering (purrr) og modelopbygning (tidymodels) osv. Pakkerne i tidyverse er designet til at arbejde problemfrit sammen og følge et ensartet sæt designprincipper. Microsoft Fabric distribuerer den nyeste stabile version af tidyverse med hver kørselsversion.

Hvis du vil vide mere om, hvordan du bruger Tidyverse, skal du gå til Sådan bruger du Tidyverse.

R-visualisering

R-økosystemet tilbyder flere grafbiblioteker, der er pakket med mange forskellige funktioner. Hver Spark-forekomst i Microsoft Fabric indeholder som standard et sæt organiserede og populære biblioteker med åben kildekode. Du kan også tilføje eller administrere ekstra biblioteker eller versioner ved hjælp af funktionerne til administration af Microsoft Fabric-biblioteker.

Få mere at vide om, hvordan du opretter R-visualiseringer ved at gå til R-visualisering.