Azure Databricks üzerinde RStudio

R için popüler bir tümleşik geliştirme ortamı (IDE) olan RStudio'yu kullanarak Azure Databricks çalışma alanlarındaki Azure Databricks işlem kaynaklarına bağlanabilirsiniz. RStudio Desktop'ı kullanarak yerel geliştirme makinenizden bir Azure Databricks kümesine veya SQL ambarı'na bağlanabilirsiniz. Ayrıca web tarayıcınızı kullanarak Azure Databricks çalışma alanınızda oturum açabilir ve ardından bu çalışma alanında RStudio Server'ın yüklü olduğu bir Azure Databricks kümesine bağlanabilirsiniz.

RStudio Desktop

RStudio Desktop'ı kullanarak yerel geliştirme makinenizden uzak bir Azure Databricks kümesine veya SQL ambarı'na bağlanabilirsiniz. Bu senaryoda bağlanmak için bir ODBC bağlantısı kullanabilir ve bu bölümde açıklanan R için ODBC paket işlevlerini çağırabilirsiniz.

Not

Databricks Connect'i de kullanmadığınız sürece bu RStudio Masaüstü senaryosunda SparkR veya sparklyr gibi paketleri kullanamazsınız. RStudio Desktop'ı kullanmaya alternatif olarak, web tarayıcınızı kullanarak Azure Databricks çalışma alanınızda oturum açabilir ve ardından bu çalışma alanında RStudio Server'ın yüklü olduğu bir Azure Databricks kümesine bağlanabilirsiniz.

Yerel geliştirme makinenizde RStudio Desktop'ı ayarlamak için:

  1. R 3.3.0 veya üzerini indirip yükleyin.
  2. RStudio Desktop'ı indirip yükleyin.
  3. RStudio Desktop'ı başlatın.

(İsteğe bağlı) RStudio projesi oluşturmak için:

  1. RStudio Desktop'ı başlatın.
  2. Dosya > Yeni Proje'ye tıklayın.
  3. Yeni Dizin > Yeni Proje'yi seçin.
  4. Proje için yeni bir dizin seçin ve proje oluştur'a tıklayın.

R betiği oluşturmak için:

  1. Proje açıkken Dosya > Yeni Dosya > R Betiği'ne tıklayın.
  2. Dosya > Farklı Kaydet'e tıklayın.
  3. Dosyayı adlandırın ve kaydet'e tıklayın.

R için ODBC aracılığıyla uzak Azure Databricks kümesine veya SQL ambarı'na bağlanmak için:

  1. Uzak kümeniz veya SQL ambarınız için Sunucu ana bilgisayar adı, Bağlantı noktası ve HTTP yolu değerlerini alın. Bir küme için bu değerler Gelişmiş seçeneklerinJDBC/ODBC sekmesindedir. SQL ambarı için bu değerler Bağlantı ayrıntıları sekmesindedir.

  2. Azure Databricks kişisel erişim belirteci alın.

    Not

    En iyi güvenlik uygulaması olarak, otomatik araçlar, sistemler, betikler ve uygulamalarla kimlik doğrulaması yaparken Databricks, çalışma alanı kullanıcıları yerine hizmet sorumlularına ait erişim belirteçlerini kullanmanızı önerir. Daha fazla bilgi için bkz. Azure Databricks otomasyonu için hizmet sorumluları.

  3. Yerel makinenizin işletim sistemine göre Windows, macOS veya Linux için Databricks ODBC sürücüsünü yükleyin ve yapılandırın.

  4. Yerel makinenizin işletim sistemini temel alarak uzak kümenize veya Windows, macOS veya Linux için SQL ambarınıza ODBC Veri Kaynağı Adı (DSN) ayarlayın.

  5. RStudio konsolundan (Odağı Konsola Taşımayı Görüntüle>) CRAN'denodbc ve DBI paketlerini yükleyin. Aşağıdaki örnek, tarihli 2022-02-24CRAN anlık görüntüsünü kullanır:

    install.packages(c("odbc", "DBI"), repos = "https://cran.microsoft.com/snapshot/2022-02-24/")
    
  6. R betiğinize geri dönün (Odağı Kaynağa Taşımayı Görüntüle>), yüklü odbc ve DBI paketleri yükleyin:

    library(odbc)
    library(DBI)
    
  7. Paketteki DBIdbConnect işlevinin ODBC sürümünü çağırarak odbc paketteki odbc sürücüyü ve oluşturduğunuz ODBC DSN'sini (örneğin, bir ODBC DSN'siniDatabricks) belirtin.

    conn = dbConnect(
      drv = odbc(),
      dsn = "Databricks"
    )
    
  8. ODBC DSN aracılığıyla bir işlem çağırın; örneğin SELECT paketteki DBIdbGetQuery işlevi aracılığıyla bağlantı değişkeninin adını ve SELECT deyiminin kendisini belirten bir deyim, örneğin adlı defaultşemada (veritabanında) adlı diamonds bir tablodan:

    print(dbGetQuery(conn, "SELECT * FROM default.diamonds LIMIT 2"))
    

R betiğinin tamamı aşağıdaki gibidir:

library(odbc)
library(DBI)

conn = dbConnect(
  drv = odbc(),
  dsn = "Databricks"
)

print(dbGetQuery(conn, "SELECT * FROM default.diamonds LIMIT 2"))

Betiği çalıştırmak için kaynak görünümünde Kaynak'a tıklayın. Yukarıdaki R betiğinin sonuçları aşağıdaki gibidir:

  _c0 carat     cut color clarity depth table price    x    y    z
1   1  0.23   Ideal     E     SI2  61.5    55   326 3.95 3.98 2.43
2   2  0.21 Premium     E     SI1  59.8    61   326 3.89 3.84 2.31

RStudio Server

Web tarayıcınızı kullanarak Azure Databricks çalışma alanınızda oturum açabilir ve ardından bu çalışma alanında RStudio Server'ın yüklü olduğu bir Azure Databricks kümesine bağlanabilirsiniz.

Not

RStudio Server'a alternatif olarak, bir ODBC bağlantısı aracılığıyla yerel geliştirme makinenizden bir Azure Databricks kümesine veya SQL ambarı'na bağlanmak ve R için ODBC paket işlevlerini çağırmak için RStudio Desktop'ı kullanabilirsiniz. Databricks Connect'i de kullanmadığınız sürece RStudio Desktop senaryosunda SparkR veya sparklyr gibi paketleri kullanamazsınız.

RStudio Server için Azure Databricks'te Açık Kaynak Sürümü veya RStudio Workbench (eski adıyla RStudio Server Pro) sürümünü kullanabilirsiniz. RStudio Workbench / RStudio Server Pro kullanmak istiyorsanız, mevcut RStudio Workbench / RStudio Server Pro lisansınızı Azure Databricks'e aktarmanız gerekir (bkz. RStudio Workbench'i (daha önce RStudio Server Pro) kullanmaya başlama).

Databricks, küme başlangıç sürelerini azaltmak için RStudio Server ile Azure Databricks kümelerinde Machine Learning için Databricks Runtime (Databricks Runtime ML) kullanmanızı önerir. Databricks Runtime ML, kaynak kodun GitHub'da bulunabileceği RStudio Server Açık Kaynak Sürümü paketinin değiştirilmemiş bir sürümünü içerir. Aşağıdaki tabloda, Şu anda Databricks Runtime ML sürümlerine önceden yüklenmiş olan RStudio Server Açık Kaynak Sürümü sürümü listelenmektedir.

ML Sürümü için Databricks Runtime RStudio Sunucu Sürümü
Databricks Runtime 7.3 LTS ML 1.2
Databricks Runtime 9.1 LTS ML ve 10.4 LTS ML 1.4

RStudio tümleştirme mimarisi

Azure Databricks'te RStudio Server kullandığınızda, RStudio Server Daemon bir Azure Databricks kümesinin sürücü düğümünde çalışır. RStudio web kullanıcı arabirimi, Azure Databricks web uygulaması aracılığıyla kullanıma açıktır ve bu da küme ağ yapılandırmanızda herhangi bir değişiklik yapmanız gerekmediği anlamına gelir. Bu diyagramda RStudio tümleştirme bileşeni mimarisi gösterilmektedir.

Databricks üzerinde RStudio mimarisi

Uyarı

Azure Databricks, RStudio web hizmetini kümenin Spark sürücüsündeki 8787 numaralı bağlantı noktasından proxy'ler. Bu web proxy'si yalnızca RStudio ile kullanılmak üzere tasarlanmıştır. 8787 numaralı bağlantı noktasında diğer web hizmetlerini başlatırsanız, kullanıcılarınızı olası güvenlik açıklarına maruz bırakabilirsiniz. Bir kümeye desteklenmeyen yazılımların yüklenmesinden kaynaklanan sorunlardan ne Databricks ne de Microsoft sorumludur.

Gereksinimler

RStudio Server Açık Kaynak Sürümünü kullanmaya başlama

Önemli

Databricks Runtime 7.0 ML veya üzerini kullanıyorsanız, RStudio Server Açık Kaynak Sürümü zaten yüklüdür. RStudio Server'ı yükleme bölümünü atlayabilir ve RStudio Server Açık Kaynak Sürümünü Kullanma bölümüne atlayabilirsiniz.

Azure Databricks'te RStudio Server Açık Kaynak Sürümünü kullanmaya başlamak için RStudio'yu bir Azure Databricks kümesine yüklemeniz gerekir. Bu yüklemeyi yalnızca bir kez gerçekleştirmeniz gerekir. Yükleme genellikle bir yönetici tarafından gerçekleştirilir.

RStudio Server Açık Kaynak Sürümünü Yükleme

Databricks Runtime 6.6 ML veya üzerini kullanan bir Azure Databricks kümesinde RStudio Server Açık Kaynak Sürümünü ayarlamak için, RStudio Server Açık Kaynak Sürümü ikili paketini yüklemek için bir init betiği oluşturmanız gerekir. Daha fazla bilgi için bkz. Küme kapsamlı başlatma betikleri. Aşağıda, DBFS'deki bir konuma init betiği yükleyen örnek bir not defteri hücresi verilmiştir.

Önemli

  • Tüm kullanıcıların DBFS'ye okuma ve yazma erişimi vardır, bu nedenle başlatma betiği herhangi bir kullanıcı tarafından değiştirilebilir. Bu sizin için olası bir sorunsa, Databricks init betiğini Azure Data Lake Storage 2. Nesil yerleştirmenizi ve izinlerini kısıtlamanızı önerir.

  • Sürüm notlarında bulabileceğiniz çalışma zamanınızın Ubuntu sürümüne bağlı olarak paket URL'sini değiştirmeniz gerekebilir.

script = """#!/bin/bash

set -euxo pipefail
RSTUDIO_BIN="/usr/sbin/rstudio-server"

if [[ ! -f "$RSTUDIO_BIN" && $DB_IS_DRIVER = "TRUE" ]]; then
  apt-get update
  apt-get install -y gdebi-core
  cd /tmp
  # You can find new releases at https://rstudio.com/products/rstudio/download-server/debian-ubuntu/.
  wget https://download2.rstudio.org/server/bionic/amd64/rstudio-server-2022.02.1-461-amd64.deb -O rstudio-server.deb
  sudo gdebi -n rstudio-server.deb
  rstudio-server restart || true
fi
"""

dbutils.fs.mkdirs("/databricks/rstudio")
dbutils.fs.put("/databricks/rstudio/rstudio-install.sh", script, True)
  1. Betiği yüklemek için not defterinde kodu çalıştırma dbfs:/databricks/rstudio/rstudio-install.sh
  2. Kümeyi başlatmadan önce init betiği olarak ekleyin dbfs:/databricks/rstudio/rstudio-install.sh . Ayrıntılar için bkz. Küme kapsamlı başlatma betikleri .
  3. Kümeyi başlatın.

RStudio Server Açık Kaynak Sürümünü Kullanma

  1. RStudio Sunucusu Açık Kaynağı'nın yüklü olduğu kümenin ayrıntılarını görüntüleyin ve ardından Uygulamalar sekmesine tıklayın:

    Küme Uygulamaları sekmesi

  2. Uygulamalar sekmesinde RStudio'yu Ayarla düğmesine tıklayın. Bu, sizin için tek seferlik bir parola oluşturur. Göstermek için göster bağlantısına tıklayın ve parolayı kopyalayın.

    RStudio tek seferlik parola

  3. Kullanıcı arabirimini yeni bir sekmede açmak için RStudio'yu Aç bağlantısına tıklayın. Oturum açma formuna kullanıcı adınızı ve parolanızı girin ve oturum açın.

    RStudio oturum açma formu

  4. RStudio kullanıcı arabiriminden paketi içeri aktarabilir SparkR ve kümenizde Spark işlerini başlatmak için bir SparkR oturum ayarlayabilirsiniz.

    library(SparkR)
    
    sparkR.session()
    
    # Query the first two rows of a table named "diamonds" in a
    # schema (database) named "default" and display the query result.
    df <- SparkR::sql("SELECT * FROM default.diamonds LIMIT 2")
    showDF(df)
    

    RStudio Open Source Edition oturumu

  5. Ayrıca sparklyr paketini ekleyebilir ve bir Spark bağlantısı ayarlayabilirsiniz.

    library(sparklyr)
    
    sc <- spark_connect(method = "databricks")
    
    # Query a table named "diamonds" and display the first two rows.
    df <- spark_read_table(sc = sc, name = "diamonds")
    print(x = df, n = 2)
    

    RStudio Açık Kaynak Sürümü sparklyr bağlantısı

RStudio Workbench'i (eski adıyla RStudio Server Pro) kullanmaya başlama

Şubat 2022'de RStudio Server Pro, RStudio Workbench (ad değişikliği hakkında SSS) olarak yeniden adlandırıldı. Lisansınıza bağlı olarak, RStudio Workbench RStudio Server Pro'yu içerebilir.

RStudio lisans sunucusunu ayarlama

RStudio Workbench'i Azure Databricks'te kullanmak için Pro Lisansınızı kayan lisansa dönüştürmeniz gerekir. Yardım için adresine başvurun help@rstudio.com. Lisansınız dönüştürüldüğünde RStudio Workbench için bir lisans sunucusu ayarlamanız gerekir.

Lisans sunucusu ayarlamak için:

  1. Bulut sağlayıcısı ağınızda küçük bir örnek başlatın; lisans sunucusu daemon'ı çok hafiftir.
  2. Örneğinize karşılık gelen RStudio Lisans Sunucusu sürümünü indirip yükleyin ve hizmeti başlatın. Ayrıntılı yönergeler için bkz. RStudio Workbench Yönetici Kılavuzu.
  3. Lisans sunucusu bağlantı noktasının Azure Databricks örneklerine açık olduğundan emin olun.

RStudio Workbench'i yükleme

Azure Databricks kümesinde RStudio Workbench'i ayarlamak için, RStudio Workbench ikili paketini yüklemek ve lisans kiralama için lisans sunucunuzu kullanacak şekilde yapılandırmak üzere bir init betiği oluşturmanız gerekir. Daha fazla ayrıntı için bkz. Tanılama günlükleri .

Not

RStudio Workbench'i zaten RStudio Server Open Source Edition paketini içeren bir Databricks Runtime sürümüne yüklemeyi planlıyorsanız, yüklemenin başarılı olması için önce bu paketi kaldırmanız gerekir.

Aşağıda, DBFS'de bir init betiği oluşturan örnek bir not defteri hücresi verilmiştir. Betik ayrıca Azure Databricks ile tümleştirmeyi kolaylaştıran ek kimlik doğrulama yapılandırmaları da gerçekleştirir.

Önemli

  • Tüm kullanıcıların DBFS'ye okuma ve yazma erişimi vardır, bu nedenle başlatma betiği herhangi bir kullanıcı tarafından değiştirilebilir. Bu sizin için olası bir sorunsa, Databricks init betiğini Azure Data Lake Storage 2. Nesil yerleştirmenizi ve izinlerini kısıtlamanızı önerir.

  • Sürüm notlarında bulabileceğiniz çalışma zamanınızın Ubuntu sürümüne bağlı olarak paket URL'sini değiştirmeniz gerekebilir.

script = """#!/bin/bash

set -euxo pipefail

if [[ $DB_IS_DRIVER = "TRUE" ]]; then
  sudo apt-get update
  sudo dpkg --purge rstudio-server # in case open source version is installed.
  sudo apt-get install -y gdebi-core alien

  ## Installing RStudio Workbench
  cd /tmp

  # You can find new releases at https://rstudio.com/products/rstudio/download-commercial/debian-ubuntu/.
  wget https://download2.rstudio.org/server/bionic/amd64/rstudio-workbench-2022.02.1-461.pro1-amd64.deb -O rstudio-workbench.deb
  sudo gdebi -n rstudio-workbench.deb

  ## Configuring authentication
  sudo echo 'auth-proxy=1' >> /etc/rstudio/rserver.conf
  sudo echo 'auth-proxy-user-header-rewrite=^(.*)$ $1' >> /etc/rstudio/rserver.conf
  sudo echo 'auth-proxy-sign-in-url=<domain>/login.html' >> /etc/rstudio/rserver.conf
  sudo echo 'admin-enabled=1' >> /etc/rstudio/rserver.conf
  sudo echo 'export PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin' >> /etc/rstudio/rsession-profile

  # Enabling floating license
  sudo echo 'server-license-type=remote' >> /etc/rstudio/rserver.conf

  # Session configurations
  sudo echo 'session-rprofile-on-resume-default=1' >> /etc/rstudio/rsession.conf
  sudo echo 'allow-terminal-websockets=0' >> /etc/rstudio/rsession.conf

  sudo rstudio-server license-manager license-server <license-server-url>
  sudo rstudio-server restart || true
fi
"""

dbutils.fs.mkdirs("/databricks/rstudio")
dbutils.fs.put("/databricks/rstudio/rstudio-install.sh", script, True)
  1. değerini Azure Databricks URL'nizle ve <license-server-url> kayan lisans sunucunuzun URL'si ile değiştirin<domain>.
  2. Betiği yüklemek için bir not defterinde kodu çalıştırın dbfs:/databricks/rstudio/rstudio-install.sh
  3. Kümeyi başlatmadan önce init betiği olarak ekleyin dbfs:/databricks/rstudio/rstudio-install.sh . Ayrıntılar için bkz. Tanılama günlükleri .
  4. Kümeyi başlatın.

RStudio Server Pro kullanma

  1. RStudio'yu yüklediğiniz kümenin ayrıntılarını görüntüleyin ve Uygulamalar sekmesine tıklayın:

    Küme Uygulamaları sekmesi

  2. Uygulamalar sekmesinde RStudio'yu Ayarla düğmesine tıklayın.

    RStudio tek seferlik parola

  3. Tek seferlik parolaya ihtiyacınız yoktur. RStudio kullanıcı arabirimini aç bağlantısına tıkladığınızda kimliği doğrulanmış bir RStudio Pro oturumu açılır.

  4. RStudio kullanıcı arabiriminden paketi ekleyebilir SparkR ve kümenizde Spark işlerini başlatmak için bir SparkR oturum ayarlayabilirsiniz.

    library(SparkR)
    
    sparkR.session()
    
    # Query the first two rows of a table named "diamonds" in a
    # schema (database) named "default" and display the query result.
    df <- SparkR::sql("SELECT * FROM default.diamonds LIMIT 2")
    showDF(df)
    

    RStudio Pro oturumu

  5. Ayrıca sparklyr paketini ekleyebilir ve bir Spark bağlantısı ayarlayabilirsiniz.

    library(sparklyr)
    
    sc <- spark_connect(method = "databricks")
    
    # Query a table named "diamonds" and display the first two rows.
    df <- spark_read_table(sc = sc, name = "diamonds")
    print(x = df, n = 2)
    

    RStudio Pro sparklyr bağlantısı

RStudio Server için sık sorulan sorular (SSS)

RStudio Server Açık Kaynak Sürümü ile RStudio Workbench arasındaki fark nedir?

RStudio Workbench, Open Source Edition'da bulunmayan çok çeşitli kurumsal özellikleri destekler. RStudio'nun web sitesinde özellik karşılaştırmasını görebilirsiniz.

Buna ek olarak, RStudio Server Açık Kaynak Sürümü GNU Affero Genel Kamu Lisansı (AGPL) altında dağıtılırken Pro sürümü AGPL yazılımını kullanamayacak kuruluşlar için ticari bir lisansla birlikte gelir.

Son olarak RStudio Workbench, RStudio, PBC'den profesyonel ve kurumsal destekle birlikte sunulurken, RStudio Server Open Source Edition desteği yoktur.

Azure Databricks'te RStudio Workbench / RStudio Server Pro lisansımı kullanabilir miyim?

Evet, RStudio Server için zaten bir Pro veya Enterprise lisansınız varsa bu lisansı Azure Databricks'te kullanabilirsiniz. Azure Databricks'te RStudio Workbench'i ayarlamayı öğrenmek için bkz. RStudio Workbench'i (eski adıyla RStudio Server Pro) kullanmaya başlama .

RStudio Server nerede çalışır? Ek hizmetleri/sunucuları yönetmem gerekiyor mu?

RStudio tümleştirme mimarisindeki diyagramda görebileceğiniz gibi, RStudio Server daemon'u Azure Databricks kümenizin sürücü (ana) düğümünde çalışır. RStudio Server Açık Kaynak Sürümü ile ek sunucu/hizmet çalıştırmanız gerekmez. Ancak, RStudio Workbench için RStudio Lisans Sunucusu çalıştıran ayrı bir örneği yönetmeniz gerekir.

RStudio Sunucusu'nu standart bir kümede kullanabilir miyim?

Not

Bu makalede eski Kümeler kullanıcı arabirimi açıklanmaktadır. Küme erişim modları için terminoloji değişiklikleri de dahil olmak üzere Önizleme kullanıcı arabiriminin ayrıntıları için bkz. Databricks Kümeleri kullanıcı arabirimi değişiklikleri.

Evet, yazabilirsiniz. Başlangıçta , yüksek eşzamanlılık kümesi kullanmanız gerekiyordu, ancak bu sınırlama artık geçerli değildir.

RStudio Server'i otomatik sonlandırma ile bir kümede kullanabilir miyim?

Hayır, otomatik sonlandırma etkinleştirildiğinde RStudio'yu kullanamazsınız. Otomatik sonlandırma, RStudio oturumu içindeki kaydedilmemiş kullanıcı betiklerini ve verilerini temizleyebilir. Kullanıcıları bu istenmeyen veri kaybı senaryosuna karşı korumak için RStudio bu tür kümelerde varsayılan olarak devre dışı bırakılır.

Kullanılmadığında küme kaynaklarının temizlenmesini gerektiren müşteriler için Databricks, RStudio kümelerini bir zamanlamaya göre temizlemek için küme API'lerinin kullanılmasını önerir.

RStudio'da çalışmamı nasıl sürdürmeliyim?

RStudio'dan bir sürüm denetim sistemi kullanarak çalışmanızı kalıcı hale yapmanızı kesinlikle öneririz. RStudio, çeşitli sürüm denetim sistemleri için harika bir desteğe sahiptir ve projelerinizi iade edip yönetmenizi sağlar.

Ayrıca dosyalarınızı (kod veya veriler) Databricks Dosya Sistemi (DBFS) nedir? üzerine de kaydedebilirsiniz. Örneğin, kümeniz sonlandırıldığında veya yeniden başlatıldığında dosyaların altındaki /dbfs/ bir dosyayı kaydederseniz silinmez.

Önemli

Kodunuzu sürüm denetimi veya DBFS aracılığıyla kalıcı yapmazsanız, bir yönetici kümeyi yeniden başlatır veya sonlandırırsa çalışmanızı kaybetme riskiyle karşı karşıya kalırsınız.

Bir diğer yöntem de R not defterini olarak Rmarkdowndışarı aktarıp daha sonra dosyayı RStudio örneğine aktararak yerel dosya sisteminize kaydetmektir.

RMarkdown kullanarak R Not Defterlerini Paylaşma blogu, adımları daha ayrıntılı olarak açıklar.

Oturum Nasıl yaparım? başlatılamıyorSparkR?

SparkR Databricks Runtime'da bulunur, ancak RStudio'ya yüklemeniz gerekir. Oturumu başlatmak SparkR için RStudio içinde aşağıdaki kodu çalıştırın.

library(SparkR)

sparkR.session()

Paketi içeri aktarırken SparkR bir hata varsa komutunu çalıştırın .libPaths() ve sonucun içerdiğini /home/ubuntu/databricks/spark/R/lib doğrulayın.

Dahil değilse içeriğini /usr/lib/R/etc/Rprofile.sitedenetleyin. Paketin yüklü olduğunu doğrulamak için sürücüde SparkR listeleyin/home/ubuntu/databricks/spark/R/lib/SparkR.

Oturum Nasıl yaparım? başlatılamıyorsparklyr?

Paketin sparklyr kümeye yüklenmesi gerekir. Paketi yüklemek sparklyr için aşağıdaki yöntemlerden birini kullanın:

  • Azure Databricks kitaplığı olarak
  • install.packages() komutu
  • RStudio paket yönetimi kullanıcı arabirimi
library(sparklyr)

sc <- spark_connect(method = “databricks”)

RStudio, Azure Databricks R not defterleriyle nasıl tümleşir?

Çalışmanızı sürüm denetimi aracılığıyla not defterleri ve RStudio arasında taşıyabilirsiniz.

Çalışma dizini nedir?

RStudio'da bir proje başlattığınızda bir çalışma dizini seçersiniz. Varsayılan olarak bu, RStudio Server'ın çalıştığı sürücü (ana) kapsayıcısının giriş dizinidir. İsterseniz bu dizini değiştirebilirsiniz.

Azure Databricks'te RStudio'nun içinde terminal veya git kullanamıyorum. Bunu nasıl düzeltebilirim?

Web yuvalarını devre dışı bırakmış olduğunuzdan emin olun. RStudio Server Açık Kaynak Sürümü'nde bunu kullanıcı arabiriminden yapabilirsiniz.

RStudio Oturumu

RStudio Server Pro'da, web yuvalarını tüm kullanıcılar için devre dışı bırakmak için öğesine ekleyebilirsiniz allow-terminal-websockets=0/etc/rstudio/rsession.conf .

Küme ayrıntıları altında Uygulamalar sekmesini görmüyorum.

Bu özellik tüm müşteriler tarafından kullanılamaz. Premium Plan'da olmanız gerekir.

Azure Databricks üzerinde çalışan RStudio'dan Shiny Apps'i başlatabilir miyim?

Evet, Databricks'te RStudio Server içinde Shiny uygulamaları geliştirebilir ve görüntüleyebilirsiniz.