Az IntelliJ IDEA használata a Scalához készült Databricks Csatlakozás

Cikk
04/19/2024

Feljegyzés

Ez a cikk a Databricks-Csatlakozás a Databricks Runtime 13.3 LTS-hez és újabb verziókhoz.

Ez a cikk bemutatja, hogyan használható a Databricks Csatlakozás a Scalához és az IntelliJ IDEA-hoz a Scala beépülő modullal. A Databricks Csatlakozás lehetővé teszi népszerű azonosítók, notebook-kiszolgálók és más egyéni alkalmazások Azure Databricks-fürtökhöz való csatlakoztatását. Lásd: Mi az a Databricks Csatlakozás?.

Feljegyzés

A Databricks Csatlakozás használatának megkezdése előtt be kell állítania a Databricks Csatlakozás-ügyfelet.

Ha a Databricks Csatlakozás és az IntelliJ IDEA-t a Scala beépülő modullal szeretné használni egy Scala-mintaprojekt sbt létrehozásához, futtatásához és hibakereséséhez, kövesse az alábbi utasításokat. Ezeket az utasításokat az IntelliJ IDEA Community Edition 2023.3.6-os verziójával teszteltük. Ha az IntelliJ IDEA másik verzióját vagy kiadását használja, az alábbi utasítások eltérhetnek.

Győződjön meg arról, hogy a Java Development Kit (JDK) helyileg telepítve van. A Databricks azt javasolja, hogy a helyi JDK-verzió egyezzen az Azure Databricks-fürt JDK-verziójával.
Indítsa el az IntelliJ IDEA-t.
Kattintson az Új > projekt fájlja > elemre.
Adjon egy értelmes nevet a projektnek.
A Hely beállításhoz kattintson a mappa ikonra, és végezze el a képernyőn megjelenő utasításokat az új Scala-projekt elérési útjának megadásához.
A Nyelv területen kattintson a Scala elemre.
Build rendszer esetén kattintson az sbt gombra.
A JDK legördülő listában válassza ki a JDK meglévő telepítését a fejlesztői gépen, amely megfelel a fürt JDK-verziójának, vagy válassza a JDK letöltése lehetőséget, és kövesse a képernyőn megjelenő utasításokat a fürt JDK-verziójának megfelelő JDK letöltéséhez.

Feljegyzés

Ha olyan JDK-telepítést választ, amely a fürt JDK-verziója felett vagy alatt található, váratlan eredményeket eredményezhet, vagy előfordulhat, hogy a kód egyáltalán nem fut.
Az sbt legördülő listában válassza ki a legújabb verziót.
A Scala legördülő listában válassza ki a Scala azon verzióját, amely megfelel a fürt Scala-verziójának.

Feljegyzés

Ha olyan Scala-verziót választ, amely a fürt Scala-verziója alatt vagy felett van, az váratlan eredményeket eredményezhet, vagy előfordulhat, hogy a kód egyáltalán nem fut.
Csomagelőtag esetén adjon meg egy csomagelőtag-értéket a projekt forrásaihoz, példáulorg.example.application.
Győződjön meg arról, hogy a Mintakód hozzáadása jelölőnégyzet be van jelölve.
Kattintson a Létrehozás gombra.
Adja hozzá a Databricks Csatlakozás csomagot: az új Scala-projekttel nyissa meg a Project eszközablakában (Windows Project megtekintése >>) a projektnév> célhelyen található build.sbtnevű fájlt.
Adja hozzá a következő kódot a build.sbt fájl végéhez, amely deklarálja a projekt függőségét a Scala Databricks Csatlakozás könyvtárának egy adott verziójától:
```
libraryDependencies += "com.databricks" % "databricks-connect" % "14.3.1"
```
Cserélje le 14.3.1 a Databricks Csatlakozás könyvtár azon verziójára, amely megfelel a fürt Databricks Runtime-verziójának. A Databricks Csatlakozás kódtár verziószámait a Maven központi adattárában találja.
Kattintson a Load sbt changes notification icon(sbt) ikonra a Scala-projekt új erőforrástár helyével és függőségével való frissítéséhez.
Várjon, amíg az sbt IDE alján lévő állapotjelző eltűnik. A sbt betöltési folyamat végrehajtása eltarthat néhány percig.
Kód hozzáadása: a Project eszközablakban nyissa meg a project-name> src > main > scala nevű Main.scala fájlt.

Cserélje le a fájl meglévő kódját a következő kódra, majd mentse a fájlt:

package org.example.application

import com.databricks.connect.DatabricksSession
import org.apache.spark.sql.SparkSession

object Main {
  def main(args: Array[String]): Unit = {
    val spark = DatabricksSession.builder().remote().getOrCreate()
    val df = spark.read.table("samples.nyctaxi.trips")
    df.limit(5).show()
  }
}

Futtassa a kódot: indítsa el a célfürtöt a távoli Azure Databricks-munkaterületen.
A fürt elindítása után a főmenüben kattintson a Futtatás főmenüre>.
A Futtatás eszközablakban (Az eszköz windows > futtatása megtekintése>) a Fő lapon megjelenik a samples.nyctaxi.trips táblázat első 5 sora. Az összes Scala-kód helyileg fut, míg a DataFrame-műveleteket tartalmazó Összes Scala-kód a távoli Azure Databricks-munkaterület fürtjén fut, és a futtatási válaszok vissza lesznek küldve a helyi hívónak.
Hibakeresés a kódban: indítsa el a célfürtöt a távoli Azure Databricks-munkaterületen, ha még nem fut.
Az előző kódban a töréspont beállításához kattintson a mellette lévő ereszcsatornára df.limit(5).show() .
A fürt elindítása után a főmenüben kattintson a Fő hibakeresés futtatása > parancsra.
A Hibakeresés eszközablakban (Az eszköz windowsos > hibakeresésének megtekintése>) a Konzol lapon kattintson a számológép (Kifejezés kiértékelése) ikonra.
Adja meg a kifejezéstdf.schema, és kattintson a Kiértékelés gombra a DataFrame sémájának megjelenítéséhez.
A Hibakeresés eszköz ablakának oldalsávján kattintson a zöld nyílra (Program folytatása) ikonra.
A Konzol panelen megjelenik a samples.nyctaxi.trips táblázat első 5 sora. Az összes Scala-kód helyileg fut, míg a DataFrame-műveleteket tartalmazó Összes Scala-kód a távoli Azure Databricks-munkaterület fürtjén fut, és a futtatási válaszok vissza lesznek küldve a helyi hívónak.

Megosztás a következőn keresztül:

Az IntelliJ IDEA használata a Scalához készült Databricks Csatlakozás

Visszajelzés

További források