A Visual Studio Code használata a Pythonhoz készült Databricks Connecttel
Feljegyzés
Ez a cikk a Databricks Runtime 13.3 LTS-hez készült Databricks Connectet ismerteti.
Ez a cikk bemutatja, hogyan használhatja a Databricks Connect for Pythont a Visual Studio Code-tal. A Databricks Connect lehetővé teszi népszerű azonosítók, notebook-kiszolgálók és más egyéni alkalmazások Azure Databricks-fürtökhöz való csatlakoztatását. Lásd : Mi az a Databricks Connect?. A cikk Scala-verziójáról a Visual Studio Code használata a Databricks Connect for Scalához című témakörben olvashat.
Feljegyzés
A Databricks Connect használatának megkezdése előtt be kell állítania a Databricks Connect-ügyfelet.
Tipp.
A Visual Studio Code Databricks bővítménye már beépített támogatást nyújt a Databricks Connect for Databricks Runtime 13.3 LTS-hez és újabb verziókhoz. Lásd: Hibakeresési kód a Databricks Connect használatával a Visual Studio Code Databricks-bővítményéhez.
A Databricks Connect Visual Studio Code-tal és Pythonnal való használatához kövesse az alábbi utasításokat.
Indítsa el a Visual Studio Code-ot.
Nyissa meg a Python virtuális környezetet tartalmazó mappát (Fájlmegnyitás > mappa).
A Visual Studio Code Terminálban (Terminál megtekintése>) aktiválja a virtuális környezetet.
Állítsa be az aktuális Python-értelmezőt a virtuális környezetből hivatkozott értelmezőre:
- Írja be a parancskatalógusba (parancskatalógus megtekintése>), majd nyomja le az Enter billentyűt.
Python: Select Interpreter
- Válassza ki a virtuális környezetből hivatkozott Python-értelmező elérési útját.
- Írja be a parancskatalógusba (parancskatalógus megtekintése>), majd nyomja le az Enter billentyűt.
Adjon hozzá egy Python-kódfájlt (
.py
) a mappához, amely a példakódot vagy a saját kódját tartalmazza. Ha saját kódot használ, legalább inicializálniaDatabricksSession
kell a példakódban látható módon.A kód futtatásához kattintson a Futtatás > hibakeresés nélkül parancsra a főmenüben. Az összes Python-kód helyileg fut, míg a DataFrame-műveleteket tartalmazó PySpark-kód a távoli Azure Databricks-munkaterület fürtjén fut, és a futtatási válaszokat a rendszer visszaküldi a helyi hívónak.
A kód hibakeresése:
- Ha meg van nyitva a Python-kódfájl, állítsa be azokat a töréspontokat, ahol azt szeretné, hogy a kód futás közben szüneteljen.
- Kattintson az oldalsávOn a Futtatás és hibakeresés ikonra, vagy kattintson a Főmenü Futtatás megtekintése parancsára>.
- A Futtatás és hibakeresés nézetben kattintson a Futtatás és hibakeresés gombra.
- A kód futtatásához és hibakereséséhez kövesse a képernyőn megjelenő utasításokat.
Az összes Python-kód helyileg van hibakereséssel, míg az összes PySpark-kód továbbra is fut a fürtben a távoli Azure Databricks-munkaterületen. Az alapvető Spark-motorkódot nem lehet közvetlenül az ügyfélből hibakeresésre használni.
A konkrétabb futtatási és hibakeresési utasításokért tekintse meg a hibakereső és a Python hibakeresésének konfigurálását és futtatását a VS Code-ban.