Apache Spark için R kullanma

Microsoft Fabric, Apache Spark için yerleşik R desteği sağlar. Bu, kullanıcıların tanıdık Spark veya R arabirimlerini kullanarak Spark ile etkileşim kurmasına olanak tanıyan SparkR ve sparklyr desteğini içerir. Spark toplu iş tanımları aracılığıyla R kullanarak veya etkileşimli Microsoft Fabric not defterleriyle verileri analiz edebilirsiniz.

Bu belge, R dilini kullanarak Synapse'te Spark uygulamaları geliştirmeye genel bir bakış sağlar.

Önkoşullar

Not defteri oturumları oluşturma ve çalıştırma

Microsoft Fabric not defteri, canlı kod, görselleştirmeler ve anlatı metni içeren dosyalar oluşturmanız için kullanabileceğiniz bir web arabirimidir. Not defterleri, fikirleri doğrulamak ve hızlı denemeler yaparak verilerinizden içgörüler elde etmek için iyi bir yerdir. Not defterleri veri hazırlama, veri görselleştirme, makine öğrenmesi ve diğer büyük veri senaryolarında da yaygın olarak kullanılır.

Microsoft Fabric not defterlerinde R kullanmaya başlamak için dil seçeneğini SparkR (R) olarak ayarlayarak not defterinizin en üstündeki birincil dili değiştirin.

Buna ek olarak, bir not defterinde bir hücrenin başında language magic komutunu belirterek birden çok dil kullanabilirsiniz.

%%sparkr
# Enter your R code here

Microsoft Fabric Analytics'in içindeki not defterleri hakkında daha fazla bilgi edinmek için bkz . Not defterlerini kullanma.

Paketleri yükleme

Kitaplıklar, programlarınıza veya projelerinize eklemek isteyebileceğiniz yeniden kullanılabilir kod sağlar. Üçüncü taraf veya yerel olarak oluşturulmuş kodu uygulamalarınız için kullanılabilir hale getirmek için, çalışma alanı veya not defteri oturumlarınızdan birine bir kitaplık yükleyebilirsiniz.

R kitaplıklarını yönetme hakkında daha fazla bilgi edinmek için bkz . R kitaplığı yönetimi.

Not defteri yardımcı programları

Microsoft Spark Yardımcı Programları (MSSparkUtils), ortak görevleri kolayca gerçekleştirmenize yardımcı olan yerleşik bir pakettir. MSSparkUtils'i dosya sistemleriyle çalışmak, ortam değişkenlerini almak, not defterlerini birbirine zincirleme ve gizli dizilerle çalışmak için kullanabilirsiniz. MSSparkUtils, R not defterleri için desteklenir.

Başlamak için aşağıdaki komutları çalıştırabilirsiniz:

library(notebookutils)
mssparkutils.fs.help()

Desteklenen MSSparkUtils komutları hakkında daha fazla bilgi için bkz . Microsoft Spark Yardımcı Programlarını Kullanma.

SparkR kullanma

SparkR , R'den Apache Spark'ı kullanmak için hafif bir ön uç sağlayan bir R paketidir. SparkR, seçim, filtreleme, toplama gibi işlemleri destekleyen dağıtılmış bir veri çerçevesi uygulaması sağlar. SparkR, MLlib kullanarak dağıtılmış makine öğrenmesini de destekler.

SparkR'yi kullanma hakkında daha fazla bilgi edinmek için SparkR'yi kullanma adresini ziyaret edebilirsiniz.

Sparklyr kullanma

sparklyr , Apache Spark için bir R arabirimidir. Tanıdık R arabirimlerini kullanarak Spark ile etkileşime geçmek için bir mekanizma sağlar. Spark toplu iş tanımları aracılığıyla veya etkileşimli Microsoft Fabric not defterleriyle sparklyr kullanabilirsiniz.

Sparklyr'ı kullanma hakkında daha fazla bilgi edinmek için Sparklyr'ı kullanma adresini ziyaret edin.

Tidyverse kullanma

Tidyverse , veri bilimciler tarafından günlük veri analizlerinde yaygın olarak kullanılan bir R paketleri koleksiyonudur. Veri içeri aktarma (), veri görselleştirme (readrggplot2), veri işleme (dplyr, tidyr), işlevsel programlama (purrr) ve model oluşturma (tidymodels) gibi paketler içerir. içindeki tidyverse paketler sorunsuz bir şekilde birlikte çalışacak ve tutarlı bir tasarım ilkeleri kümesini izleyecek şekilde tasarlanmıştır. Microsoft Fabric, en son kararlı sürümünü her çalışma zamanı sürümüyle tidyverse dağıtır.

Tidyverse'i kullanma hakkında daha fazla bilgi edinmek için Tidyverse'i kullanma adresini ziyaret edin.

R görselleştirmesi

R ekosistemi, birçok farklı özellik içeren birden çok grafik kitaplığı sunar. Varsayılan olarak, Microsoft Fabric'teki her Spark örneği bir dizi seçilmiş ve popüler açık kaynak kitaplık içerir. Ayrıca, Microsoft Fabric kitaplık yönetimi özelliklerini kullanarak ek kitaplıklar veya sürümler ekleyebilir veya yönetebilirsiniz.

R görselleştirmesini ziyaret ederek R görselleştirmeleri oluşturma hakkında daha fazla bilgi edinin.