Apache Spark için R kullanma

Microsoft Fabric, Apache Spark için yerleşik R desteği sağlar. Bu, kullanıcıların tanıdık Spark veya R arabirimlerini kullanarak Spark ile etkileşim kurmasını sağlayan SparkR ve sparklyr desteğini içerir. Spark toplu iş tanımları aracılığıyla veya etkileşimli Microsoft Fabric not defterleriyle R kullanarak verileri analiz edebilirsiniz.

Önemli

Microsoft Fabric önizleme aşamasındadır.

Bu belge, R dilini kullanarak Synapse'te Spark uygulamaları geliştirmeye genel bir bakış sağlar.

Önkoşullar

  • Power BI Premium aboneliği. Aboneliğiniz yoksa bkz. Power BI Premium satın alma.

  • Premium kapasite atanmış bir Power BI çalışma alanı. Çalışma alanınız yoksa, çalışma alanı oluşturma bölümündeki adımları kullanarak bir çalışma alanı oluşturun ve bunu Premium kapasiteye atayın.

  • Microsoft Fabric'te oturum açın.

Not defteri oturumları oluşturma ve çalıştırma

Microsoft Fabric not defteri, canlı kod, görselleştirmeler ve anlatı metni içeren dosyalar oluşturmanız için kullanabileceğiniz bir web arabirimidir. Not defterleri, fikirleri doğrulamak ve hızlı denemeler yaparak verilerinizden içgörüler elde etmek için iyi bir yerdir. Not defterleri veri hazırlama, veri görselleştirme, makine öğrenmesi ve diğer büyük veri senaryolarında da yaygın olarak kullanılır.

Microsoft Fabric not defterlerinde R kullanmaya başlamak için, dil seçeneğini SparkR (R) olarak ayarlayarak not defterinizin en üstündeki birincil dili değiştirin.

Buna ek olarak, hücrenin başında dil büyüsü komutunu belirterek bir not defterinde birden çok dil kullanabilirsiniz.

%%sparkr
# Enter your R code here

Microsoft Fabric Analytics'in içindeki not defterleri hakkında daha fazla bilgi edinmek için bkz. Not defterlerini kullanma.

Paketleri yükleme

Kitaplıklar, programlarınıza veya projelerinize eklemek isteyebileceğiniz yeniden kullanılabilir kodlar sağlar. Üçüncü taraf veya yerel olarak oluşturulmuş kodu uygulamalarınız için kullanılabilir hale getirmek için, çalışma alanı veya not defteri oturumlarınızdan birine bir kitaplık yükleyebilirsiniz.

R kitaplıklarını yönetme hakkında daha fazla bilgi edinmek için bkz. R kitaplığı yönetimi.

Not defteri yardımcı programları

Microsoft Spark Yardımcı Programları (MSSparkUtils), ortak görevleri kolayca gerçekleştirmenize yardımcı olan yerleşik bir pakettir. MSSparkUtils kullanarak dosya sistemleriyle çalışabilir, ortam değişkenlerini alabilir, not defterlerini birbirine zincirleyebilir ve gizli dizilerle çalışabilirsiniz. MSSparkUtils, R not defterleri için desteklenir.

Başlamak için aşağıdaki komutları çalıştırabilirsiniz:

library(notebookutils)
mssparkutils.fs.help()

Desteklenen MSSparkUtils komutları hakkında daha fazla bilgi için bkz. Microsoft Spark Yardımcı Programlarını Kullanma.

SparkR kullanma

SparkR , R'den Apache Spark'ı kullanmak için hafif bir ön uç sağlayan bir R paketidir. SparkR, seçim, filtreleme, toplama gibi işlemleri destekleyen dağıtılmış bir veri çerçevesi uygulaması sağlar. SparkR, MLlib kullanarak dağıtılmış makine öğrenmesi özelliğini de destekler.

SparkR'yi kullanma hakkında daha fazla bilgi edinmek için SparkR'yi kullanma adresini ziyaret edebilirsiniz.

Sparklyr kullanma

sparklyr , Apache Spark için bir R arabirimidir. Tanıdık R arabirimlerini kullanarak Spark ile etkileşime geçmek için bir mekanizma sağlar. Spark toplu iş tanımları aracılığıyla veya etkileşimli Microsoft Fabric not defterleriyle sparklyr kullanabilirsiniz.

Sparklyr'ı kullanma hakkında daha fazla bilgi edinmek için Sparklyr'ı kullanma adresini ziyaret edin.

Not

Aynı not defteri oturumunda SparkR ve sparklyr kullanımı henüz desteklenmiyor.

Tidyverse kullanma

Tidyverse , veri bilimciler tarafından günlük veri analizlerinde yaygın olarak kullanılan bir R paketleri koleksiyonudur. Veri içeri aktarma (), veri görselleştirme (readrggplot2), veri işleme (dplyr, tidyr), işlevsel programlama (purrr ve model oluşturma (tidymodels) gibi paketler içerir. içindeki tidyverse paketler sorunsuz bir şekilde birlikte çalışacak ve tutarlı bir tasarım ilkeleri kümesini izleyecek şekilde tasarlanmıştır. Microsoft Fabric, en son kararlı sürümünü her çalışma zamanı sürümüyle tidyverse dağıtır.

Tidyverse'i kullanma hakkında daha fazla bilgi edinmek için Tidyverse'i kullanma adresini ziyaret edin.

R görselleştirmesi

R ekosistemi, birçok farklı özellik içeren birden çok grafik kitaplığı sunar. Varsayılan olarak, Microsoft Fabric'teki her Spark örneği bir dizi seçilmiş ve popüler açık kaynak kitaplık içerir. Ayrıca, Microsoft Fabric kitaplık yönetimi özelliklerini kullanarak ek kitaplıklar veya sürümler ekleyebilir veya yönetebilirsiniz.

R görselleştirmesini ziyaret ederek R görselleştirmeleri oluşturma hakkında daha fazla bilgi edinin.

Sonraki adımlar