Megosztás a következőn keresztül:


Az R használata az Apache Sparkhoz

A Microsoft Fabric beépített R-támogatást nyújt az Apache Sparkhoz. Támogatja a SparkR-t és a Sparklyrt, amely lehetővé teszi, hogy ismerős Spark- vagy R-felületeket használjon a Spark használatához. Adatok elemzése R használatával Spark-kötegelt feladatdefiníciókkal vagy interaktív Microsoft Fabric-jegyzetfüzetekkel.

Ez a dokumentum áttekintést nyújt a Spark-alkalmazások microsoft fabricbeli R használatával történő fejlesztéséről.

Előfeltételek

Jegyzetfüzet-munkamenetek létrehozása és futtatása

A Microsoft Fabric-jegyzetfüzet egy webes felület, amellyel élő kóddal, vizualizációkkal és elbeszélő szöveggel rendelkező fájlokat hozhat létre. Jegyzetfüzetek használatával érvényesítheti az ötleteket, gyors kísérleteket futtathat, és betekintést nyerhet az adataiból. Jegyzetfüzetek használata adatelőkészítéshez, adatvizualizációhoz, gépi tanuláshoz és más big data-forgatókönyvekhez.

A Microsoft Fabric-jegyzetfüzetekben az R használatának megkezdéséhez módosítsa a jegyzetfüzet tetején lévő elsődleges nyelvetSparkR (R) értékre.

Emellett több nyelvet is használhat egy jegyzetfüzetben egy nyelvvarázsló paranccsal a cella elején.

%%sparkr
# Enter your R code here

A Microsoft Fabric Analytics jegyzetfüzeteiről további információt a Jegyzetfüzetek használata című témakörben talál.

Csomagok telepítése

A csomagok a projektekhez hozzáadott újrafelhasználható kódot biztosítják. Ha külső vagy helyi csomagokat szeretne használni a projektjeiben, telepítse őket egy munkaterületen vagy egy jegyzetfüzet-munkamenetben.

További információ az R-kódtár-kezelésről.

Jegyzetfüzet-segédprogramok

A Microsoft Spark Utilities (MSSparkUtils) egy beépített csomag, amely segít a gyakori feladatok végrehajtásában. Az MSSparkUtils használatával fájlrendszerekkel dolgozhat, környezeti változókat kérhet le, jegyzetfüzeteket láncba rendezhet, és titkos kódokkal dolgozhat. Az MSSparkUtils támogatja az R-jegyzetfüzeteket.

Első lépésként futtassa a következő parancsokat:

library(notebookutils)
mssparkutils.fs.help()

További információ a Microsoft Spark segédprogramok használatáról.

A SparkR használata

A SparkR egy R-csomag, amely az Apache Spark R-ből való használatának egyszerűsített előtere. A SparkR elosztott DataFrame-implementációt biztosít, amely támogatja az olyan műveleteket, mint a kiválasztás, a szűrés és az összesítés. A SparkR az elosztott gépi tanulást is támogatja az MLlib használatával.

További információ a SparkR használatáról.

Használja a sparklyr-t

Sparklyr az Apache Spark R-felülete. A Spark használata ismerős R-felületek használatával. Sparklyr használata Spark batch-feladatdefiníciókban vagy interaktív Microsoft Fabric-jegyzetfüzetekben.

További információ a Sparklyr használatáról.

A Tidyverse használata

A Tidyverse olyan R-csomagok gyűjteménye, amelyeket az adattudósok a mindennapi adatelemzéshez használnak. Adatimportálási (), adatvizualizációs (ggplot2readr), adatmanipulációs (dplyr, tidyr) és funkcionális programozási (purrr) csomagokat tartalmaz. A Tidyverse-csomagok együttműködnek, és következetes tervezési alapelveket követnek. A Microsoft Fabric minden futtatókörnyezeti kiadással elosztja a tidyverse legújabb stabil verzióját.

További információ a Tidyverse használatáról.

R-vizualizáció

Az R-ökoszisztéma számos gráftárat tartalmaz. Alapértelmezés szerint a Microsoft Fabric minden Spark-példánya tartalmaz válogatott nyílt forráskódú kódtárakat. Tárak és verziók hozzáadásához vagy kezeléséhez használja a Microsoft Fabric könyvtárkezelési képességeit .

Ismerje meg, hogyan hozhat létre R-vizualizációkat az R-vizualizációkban.