Megosztás a következőn keresztül:


A Visual Studio Code használata a Pythonhoz készült Databricks Connecttel

Feljegyzés

Ez a cikk a Databricks Runtime 13.3 LTS-hez készült Databricks Connectet ismerteti.

Ez a cikk bemutatja, hogyan használhatja a Databricks Connect for Pythont a Visual Studio Code-tal. A Databricks Connect lehetővé teszi népszerű azonosítók, notebook-kiszolgálók és más egyéni alkalmazások Azure Databricks-fürtökhöz való csatlakoztatását. Lásd : Mi az a Databricks Connect?. A cikk Scala-verziójáról a Visual Studio Code használata a Databricks Connect for Scalához című témakörben olvashat.

Feljegyzés

A Databricks Connect használatának megkezdése előtt be kell állítania a Databricks Connect-ügyfelet.

Tipp.

A Visual Studio Code Databricks bővítménye már beépített támogatást nyújt a Databricks Connect for Databricks Runtime 13.3 LTS-hez és újabb verziókhoz. Lásd: Hibakeresési kód a Databricks Connect használatával a Visual Studio Code Databricks-bővítményéhez.

A Databricks Connect Visual Studio Code-tal és Pythonnal való használatához kövesse az alábbi utasításokat.

  1. Indítsa el a Visual Studio Code-ot.

  2. Nyissa meg a Python virtuális környezetet tartalmazó mappát (Fájlmegnyitás > mappa).

  3. A Visual Studio Code Terminálban (Terminál megtekintése>) aktiválja a virtuális környezetet.

  4. Állítsa be az aktuális Python-értelmezőt a virtuális környezetből hivatkozott értelmezőre:

    1. Írja be a parancskatalógusba (parancskatalógus megtekintése>), majd nyomja le az Enter billentyűt.Python: Select Interpreter
    2. Válassza ki a virtuális környezetből hivatkozott Python-értelmező elérési útját.
  5. Adjon hozzá egy Python-kódfájlt (.py) a mappához, amely a példakódot vagy a saját kódját tartalmazza. Ha saját kódot használ, legalább inicializálnia DatabricksSession kell a példakódban látható módon.

  6. A kód futtatásához kattintson a Futtatás > hibakeresés nélkül parancsra a főmenüben. Az összes Python-kód helyileg fut, míg a DataFrame-műveleteket tartalmazó PySpark-kód a távoli Azure Databricks-munkaterület fürtjén fut, és a futtatási válaszokat a rendszer visszaküldi a helyi hívónak.

  7. A kód hibakeresése:

    1. Ha meg van nyitva a Python-kódfájl, állítsa be azokat a töréspontokat, ahol azt szeretné, hogy a kód futás közben szüneteljen.
    2. Kattintson az oldalsávOn a Futtatás és hibakeresés ikonra, vagy kattintson a Főmenü Futtatás megtekintése parancsára>.
    3. A Futtatás és hibakeresés nézetben kattintson a Futtatás és hibakeresés gombra.
    4. A kód futtatásához és hibakereséséhez kövesse a képernyőn megjelenő utasításokat.

    Az összes Python-kód helyileg van hibakereséssel, míg az összes PySpark-kód továbbra is fut a fürtben a távoli Azure Databricks-munkaterületen. Az alapvető Spark-motorkódot nem lehet közvetlenül az ügyfélből hibakeresésre használni.

A konkrétabb futtatási és hibakeresési utasításokért tekintse meg a hibakereső és a Python hibakeresésének konfigurálását és futtatását a VS Code-ban.