Megosztás a következőn keresztül:


A PyCharm használata a Pythonhoz készült Databricks Connecttel

Feljegyzés

Ez a cikk a Databricks Runtime 13.3 LTS-hez készült Databricks Connectet ismerteti.

Ez a cikk bemutatja, hogyan használhatja a Databricks Connect for Pythont a PyCharm használatával. A Databricks Connect lehetővé teszi népszerű azonosítók, notebook-kiszolgálók és más egyéni alkalmazások Azure Databricks-fürtökhöz való csatlakoztatását. Lásd : Mi az a Databricks Connect?.

Feljegyzés

A Databricks Connect használatának megkezdése előtt be kell állítania a Databricks Connect-ügyfelet.

Az IntelliJ IDEA Ultimate beépülő modul támogatást nyújt a PyCharmhoz a Pythonnal is. További részletekért lásd az IntelliJ IDEA Ultimate Python beépülő modulját.

A Databricks Connect PyCharm-tal és Pythonnal való használatához kövesse az alábbi utasításokat a Venv vagy a Poetry használatához. Ezt a cikket a PyCharm Community Edition 2023.3.5-ös verziójával teszteltük. Ha a PyCharm másik verzióját vagy kiadását használja, az alábbi utasítások eltérhetnek.

A PyCharm használata a Venv és a Databricks Connect for Python használatával

  1. Indítsa el a PyCharmot.

  2. Projekt létrehozása: kattintson az Új projekt fájlja elemre>.

  3. Az Új projekt párbeszédpanelen kattintson a Tiszta Python elemre.

  4. A Hely beállításhoz kattintson a mappa ikonra, majd válassza ki a Pythonhoz készült Databricks Connect telepítése szolgáltatásban létrehozott meglévő venv virtuális környezet elérési útját.

  5. Értelmező típus esetén kattintson az Egyéni környezet elemre.

  6. A Környezet beállításnál válassza a Meglévő kiválasztása lehetőséget.

  7. A Típus beállításnál válassza a Pythont.

  8. Elérési út esetén a mappaikon vagy a legördülő lista segítségével válassza ki a Python-értelmező elérési útját a meglévő venv virtuális környezetben.

    Tipp.

    A virtuális környezetHez tartozó venv Python-értelmező általában a következő helyen </path-to-venv>/binvan telepítve: . További információ: venv.

  9. Kattintson az OK gombra.

  10. Kattintson a Létrehozás gombra.

  11. Adjon hozzá egy Python-kódfájlt (.py) a projekthez, amely a példakódot vagy a saját kódját tartalmazza. Ha saját kódot használ, legalább inicializálnia DatabricksSession kell a példakódban látható módon.

  12. Ha meg van nyitva a Python-kódfájl, állítsa be azokat a töréspontokat, ahol azt szeretné, hogy a kód futás közben szüneteljen.

  13. A kód futtatásához kattintson a Futtatás parancsra>. Az összes Python-kód helyileg fut, míg a DataFrame-műveleteket tartalmazó PySpark-kód a távoli Azure Databricks-munkaterület fürtjén fut, és a futtatási válaszokat a rendszer visszaküldi a helyi hívónak.

  14. A kód hibakereséséhez kattintson a Hibakeresés futtatása parancsra.> Az összes Python-kód helyileg van hibakereséssel, míg az összes PySpark-kód továbbra is fut a fürtben a távoli Azure Databricks-munkaterületen. Az alapvető Spark-motorkódot nem lehet közvetlenül az ügyfélből hibakeresésre használni.

  15. A kód futtatásához vagy hibakereséséhez kövesse a képernyőn megjelenő utasításokat.

A konkrétabb futtatási és hibakeresési utasításokért tekintse meg a Futtatás korábbi konfigurálás és hibakeresés nélkül című témakört.

A PyCharm használata a Pythonhoz készült Poetry és Databricks Connect használatával

  1. Indítsa el a PyCharmot.

  2. Projekt létrehozása: kattintson az Új projekt fájlja elemre>.

    1. Az Új projekt párbeszédpanelen kattintson a Tiszta Python elemre.
  3. A Hely beállításhoz kattintson a mappa ikonra, majd válassza ki a Pythonhoz készült Databricks Connect telepítésében létrehozott meglévő Poetry virtuális környezet elérési útját.

  4. Értelmező típus esetén kattintson az Egyéni környezet elemre.

  5. A Környezet beállításnál válassza a Meglévő kiválasztása lehetőséget.

  6. A Típus beállításnál válassza a Pythont.

  7. Elérési út esetén a mappaikon vagy a legördülő lista segítségével válassza ki a Python-értelmező elérési útját a meglévő Poetry virtuális környezetben.

    Tipp.

    Mindenképpen válassza ki a Python-értelmező elérési útját. Ne válassza ki a végrehajtható Versek útvonalát.

    A Python-értelmező rendszerverziójának telepítéséről a Python hozzáadása a PATH-hoz című témakörben talál további információt.

  8. Kattintson az OK gombra.

  9. Kattintson a Létrehozás gombra.

  10. Adjon hozzá egy Python-kódfájlt (.py) a projekthez, amely a példakódot vagy a saját kódját tartalmazza. Ha saját kódot használ, legalább inicializálnia DatabricksSession kell a példakódban látható módon.

  11. Ha meg van nyitva a Python-kódfájl, állítsa be azokat a töréspontokat, ahol azt szeretné, hogy a kód futás közben szüneteljen.

  12. A kód futtatásához kattintson a Futtatás parancsra>. Az összes Python-kód helyileg fut, míg a DataFrame-műveleteket tartalmazó PySpark-kód a távoli Azure Databricks-munkaterület fürtjén fut, és a futtatási válaszokat a rendszer visszaküldi a helyi hívónak.

  13. A kód hibakereséséhez kattintson a Hibakeresés futtatása parancsra.> Az összes Python-kód helyileg van hibakereséssel, míg az összes PySpark-kód továbbra is fut a fürtben a távoli Azure Databricks-munkaterületen. Az alapvető Spark-motorkódot nem lehet közvetlenül az ügyfélből hibakeresésre használni.

  14. A kód futtatásához vagy hibakereséséhez kövesse a képernyőn megjelenő utasításokat.

A konkrétabb futtatási és hibakeresési utasításokért tekintse meg a Futtatás korábbi konfigurálás és hibakeresés nélkül című témakört.