Lue englanniksi

Jaa


R:n käyttäminen Apache Sparkia varten

Microsoft Fabric tarjoaa sisäänrakennettua R-tukea Apache Sparkille. Tämä sisältää SparkR- ja sparklyr-tuen, joiden avulla käyttäjät voivat käyttää Sparkiä tuttujen Spark- tai R-liittymien avulla. Voit analysoida tietoja R:n avulla Spark-erätyön määritelmien tai vuorovaikutteisten Microsoft Fabric -muistikirjojen avulla.

Tässä asiakirjassa on yleiskatsaus Spark-sovellusten kehittämisestä Synapessa R-kieltä käyttämällä.

Edellytykset

Muistikirjaistuntojen luominen ja suorittaminen

Microsoft Fabric -muistikirja on web-käyttöliittymä, jonka kautta voit luoda tiedostoja, jotka sisältävät reaaliaikaista koodia, visualisointeja ja selostustekstiä. Muistikirjat ovat hyvä paikka ideoiden vahvistamiseen ja nopeiden kokeilujen käyttöön, jotta saat merkityksellisiä tietoja tiedoistasi. Muistikirjoja käytetään myös laajalti tietojen valmistelussa, tietojen visualisoinnissa, koneoppimisessa ja muissa massadataskenaarioissa.

Aloita R:n käyttö Microsoft Fabric -muistikirjoissa vaihtamalla ensisijainen kieli muistikirjasi yläreunassa valitsemalla kieliasetukseksi SparkR (R)..

Lisäksi voit käyttää useita kieliä yhdessä muistikirjassa määrittämällä kielen taikakomennon solun alussa.

%%sparkr
# Enter your R code here

Lisätietoja Microsoft Fabric Analyticsin muistikirjoista on kohdassa Muistikirjojen käyttäminen.

Pakettien asentaminen

Kirjastot tarjoavat uudelleenkäytettävän koodin, jonka haluat ehkä sisällyttää ohjelmiin tai projekteihin. Jos haluat asettaa kolmannen osapuolen tai paikallisesti rakennetun koodin sovellusten saataville, voit asentaa kirjaston johonkin työtila- tai muistikirjaistunnostasi.

Lisätietoja R-kirjastojen hallinnasta on artikkelissa R-kirjastojen hallinta.

Muistikirja-apuohjelmat

Microsoft Spark -apuohjelmat (MSSparkUtils) on sisäinen paketti, jonka avulla voit helposti suorittaa yleisiä tehtäviä. MSSparkUtilsin avulla voit käsitellä tiedostojärjestelmiä, saada ympäristömuuttujia, ketjuttaa muistikirjoja yhteen ja käsitellä salaisia salaisuustietoja. MSSparkUtils on tuettu R-muistikirjoissa.

Pääset alkuun suorittamalla seuraavat komennot:

library(notebookutils)
mssparkutils.fs.help()

Lisätietoja tuetuista MSSparkUtils-komennoista on artikkelissa Microsoft Spark -apuohjelmien käyttäminen.

Sparkr-sparkrin käyttäminen

SparkR on R-paketti, joka tarjoaa kevyen edustan R:n Apache Sparkin käyttöön. SparkR tarjoaa hajautetun tietokehyksen toteutuksen, joka tukee toimintoja, kuten valintaa, suodatusta ja koostamista. SparkR tukee myös hajautettua koneoppimista MLlibin avulla.

Saat lisätietoja SparkR:n käyttämisestä sparkr-käytön ohjeista.

Käytä sparklyr

sparklyr on Apache Sparkin R-käyttöliittymä. Se tarjoaa mekanismin Sparkin kanssa vuorovaikuttamiseen tuttujen R-liittymien avulla. Voit käyttää sparklyr-spark-erätyön määritelmiä tai vuorovaikutteisia Microsoft Fabric -muistikirjoja.

Saat lisätietoja sparklyr-säätimen käytöstä sparklyr-parametrin käyttäminen -ohjeartikkelista.

Käytä Siistiä

Siistimpi on kokoelma R-paketteja, joita tietojenkäsittelyasiantuntijat käyttävät yleisimmin tavallisissa tietoanalyyseissä. Se sisältää paketit tietojen tuomista (readr), tietojen visualisointia (ggplot2), tietojen käsittelyä (dplyr, tidyr), funktionaalista ohjelmointia (purrr) ja mallin luomista (tidymodels) varten. In-paketit tidyverse on suunniteltu toimimaan saumattomasti yhteen ja noudattamaan yhdenmukaisia suunnitteluperiaatteita. Microsoft Fabric jakaa -sovelluksen uusimman vakaan version jokaisen suorituksenaikaisen julkaisun tidyverse yhteydessä.

Lisätietoja Siitä, miten käyttää Siistiä, on kohdassa Miten Käyttää Siistiä.

R-visualisointi

R-ekosysteemissä on useita kaaviokirjastoja, jotka ovat täynnä monia erilaisia ominaisuuksia. Microsoft Fabricin jokainen Spark-esiintymä sisältää oletusarvoisesti joukon valittuja ja suosittuja avoimen lähdekoodin kirjastoja. Voit myös lisätä tai hallita ylimääräisiä kirjastoja tai versioita käyttämällä Microsoft Fabric - kirjaston hallintaominaisuuksia.

Lue lisää siitä, miten voit luoda R-visualisointeja R-visualisointien avulla.