Scala için Databricks Bağlan ile IntelliJ IDEA kullanma
Not
Bu makalede Databricks Runtime 13.3 LTS ve üzeri için Databricks Bağlan yer alır.
Bu makalede Scala eklentisiyle Scala ve IntelliJ IDEA için Databricks Bağlan'nin nasıl kullanılacağı anlatılmaya devam eder. Databricks Bağlan popüler IDE'leri, not defteri sunucularını ve diğer özel uygulamaları Azure Databricks kümelerine bağlamanızı sağlar. Bkz. Databricks Bağlan nedir?.
Not
Databricks Bağlan kullanmaya başlamadan önce Databricks Bağlan istemcisini ayarlamanız gerekir.
Örnek bir Scala projesi oluşturmak, çalıştırmak ve hatalarını ayıklamak için Databricks Bağlan ve IntelliJ IDEA'yı Scala sbt
eklentisiyle birlikte kullanmak için bu yönergeleri izleyin. Bu yönergeler IntelliJ IDEA Community Edition 2023.3.6 ile test edilmiştir. IntelliJ IDEA'nın farklı bir sürümünü veya sürümünü kullanıyorsanız aşağıdaki yönergeler farklılık gösterebilir.
Java Geliştirme Seti'nin (JDK) yerel olarak yüklendiğinden emin olun. Databricks, yerel JDK sürümünüzün Azure Databricks kümenizdeki JDK sürümüyle eşleşmesini önerir.
IntelliJ IDEA’yı başlatın.
Yeni Proje Dosyala'ya >> tıklayın.
Projenize anlamlı bir Ad verin.
Konum için klasör simgesine tıklayın ve yeni Scala projenizin yolunu belirtmek için ekrandaki yönergeleri tamamlayın.
Dil için Scala'ya tıklayın.
Derleme sistemi için sbt'ye tıklayın.
JDK açılan listesinde, geliştirme makinenizde JDK'nin kümenizdeki JDK sürümüyle eşleşen mevcut bir yüklemesini seçin veya JDK'yi İndir'i seçin ve kümenizdeki JDK sürümüyle eşleşen bir JDK indirmek için ekrandaki yönergeleri izleyin.
Not
Kümenizdeki JDK sürümünün üzerinde veya altında bir JDK yüklemesi seçmek beklenmeyen sonuçlara neden olabilir veya kodunuz hiç çalışmayabilir.
sbt açılan listesinde en son sürümü seçin.
Scala açılan listesinde, kümenizdeki Scala sürümüyle eşleşen Scala sürümünü seçin.
Not
Kümenizdeki Scala sürümünün altında veya üstünde bir Scala sürümü seçmek beklenmeyen sonuçlara neden olabilir veya kodunuz hiç çalışmayabilir.
Paket ön eki için projenizin kaynakları için paket ön eki değeri girin, örneğin
org.example.application
.Örnek kod ekle kutusunun işaretli olduğundan emin olun.
Oluştur’a tıklayın.
Databricks Bağlan paketini ekleyin: Yeni Scala projeniz açıkken, Proje araç pencerenizde (Araç Windows > Projesini Görüntüle>) adlı
build.sbt
dosyayı proje adı> hedefinde açın.Projenizin Scala için Databricks Bağlan kitaplığının belirli bir sürümüne bağımlılığını bildiren dosyanın sonuna
build.sbt
aşağıdaki kodu ekleyin:libraryDependencies += "com.databricks" % "databricks-connect" % "14.3.1"
değerini, kümenizdeki Databricks Runtime sürümüyle eşleşen Databricks Bağlan kitaplığının sürümüyle değiştirin
14.3.1
. Databricks Bağlan kitaplığı sürüm numaralarını Maven merkezi deposunda bulabilirsiniz.Scala projenizi yeni kitaplık konumu ve bağımlılığıyla güncelleştirmek için Sbt değişikliklerini yükle bildirim simgesine tıklayın.
IDE'nin
sbt
altındaki ilerleme göstergesi kaybolana kadar bekleyin. Yükleme işlemininsbt
tamamlanması birkaç dakika sürebilir.Kod ekleyin: Proje aracı pencerenizde, adlı
Main.scala
dosyayı proje-adı> src > ana > scala'da açın.Dosyadaki mevcut tüm kodları aşağıdaki kodla değiştirin ve dosyayı kaydedin:
package org.example.application import com.databricks.connect.DatabricksSession import org.apache.spark.sql.SparkSession object Main { def main(args: Array[String]): Unit = { val spark = DatabricksSession.builder().remote().getOrCreate() val df = spark.read.table("samples.nyctaxi.trips") df.limit(5).show() } }
Kodu çalıştırın: Uzak Azure Databricks çalışma alanınızda hedef kümeyi başlatın.
Küme başlatıldıktan sonra, ana menüde Çalıştır 'Ana' çalıştır'a > tıklayın.
Çalıştır aracı penceresinde (Görünüm > Aracı Windows > Çalıştırması), Ana sekmesinde tablonun ilk 5 satırı
samples.nyctaxi.trips
görüntülenir. Tüm Scala kodu yerel olarak çalıştırılırken, DataFrame işlemlerini içeren tüm Scala kodu uzak Azure Databricks çalışma alanında kümede çalıştırılır ve yanıtları çalıştırma yerel çağırana geri gönderilir.Kodda hata ayıklama: Henüz çalışmıyorsa uzak Azure Databricks çalışma alanınızda hedef kümeyi başlatın.
Önceki kodda, kesme noktası ayarlamak için yanındaki
df.limit(5).show()
oluk simgesine tıklayın.Küme başlatıldıktan sonra, ana menüde 'Ana' Hata Ayıklamayı Çalıştır'a > tıklayın.
Hata Ayıklama aracı penceresinde (Görünüm > Aracı Windows > Hata Ayıklama), Konsol sekmesinde hesap makinesi (İfadeyi Değerlendir) simgesine tıklayın.
İfadeyi
df.schema
girin ve DataFrame şemasını göstermek için Değerlendir'e tıklayın.Hata ayıklama aracı penceresinin kenar çubuğunda yeşil ok (Programı Sürdür) simgesine tıklayın.
Konsol bölmesinde tablonun ilk 5 satırı
samples.nyctaxi.trips
görüntülenir. Tüm Scala kodu yerel olarak çalıştırılırken, DataFrame işlemlerini içeren tüm Scala kodu uzak Azure Databricks çalışma alanında kümede çalıştırılır ve yanıtları çalıştırma yerel çağırana geri gönderilir.
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin