Megosztás a következőn keresztül:


A JupyterLab használata a Pythonhoz készült Databricks Csatlakozás használatával

Megjegyzés:

Ez a cikk a Databricks Runtime 13.0-s és újabb verziókhoz készült Databricks Csatlakozás ismerteti.

Ez a cikk bemutatja, hogyan használható a Databricks Csatlakozás Pythonhoz a JupyterLab használatával. A Databricks Csatlakozás lehetővé teszi népszerű notebookkiszolgálók, azonosítók és egyéb egyéni alkalmazások Azure Databricks-fürtökhöz való csatlakoztatását. Lásd: Mi az a Databricks Csatlakozás?.

Megjegyzés:

A Databricks Csatlakozás használatának megkezdése előtt be kell állítania a Databricks Csatlakozás-ügyfelet.

A Databricks Csatlakozás a JupyterLab és a Python használatával való használatához kövesse az alábbi utasításokat.

  1. A JupyterLab telepítéséhez a Python virtuális környezet aktiválásával futtassa a következő parancsot a terminálból vagy a parancssorból:

    pip3 install jupyterlab
    
  2. A JupyterLab webböngészőben való elindításához futtassa az alábbi parancsot az aktivált Python virtuális környezetből:

    jupyter lab
    

    Ha a JupyterLab nem jelenik meg a webböngészőben, másolja ki a virtuális környezetből kiinduló localhost VAGY 127.0.0.1 onnan származó URL-címet, és írja be a webböngésző címsorába.

  3. Hozzon létre egy új jegyzetfüzetet: a JupyterLab-ban kattintson a főmenü Új > jegyzetfüzet fájlja > elemére, válassza a Python 3 (ipykernel) lehetőséget, majd kattintson a Kiválasztás gombra.

  4. A jegyzetfüzet első cellájába írja be a példakódot vagy a saját kódját. Ha saját kódot használ, legalább inicializálnia DatabricksSession kell a példakódban látható módon.

  5. A jegyzetfüzet futtatásához kattintson az Összes cella futtatása parancsra>. Az összes kód helyileg fut, míg a DataFrame-műveleteket tartalmazó összes kód a távoli Azure Databricks-munkaterület fürtjén fut, és a futtatási válaszok vissza lesznek küldve a helyi hívónak.

  6. A jegyzetfüzet hibakereséséhez kattintson a Python 3 (ipykernel) melletti hiba (Hibakereső engedélyezése) ikonra a jegyzetfüzet eszköztárában. Állítson be egy vagy több töréspontot, majd kattintson az Összes cella futtatása parancsra>. Az összes kód helyileg van hibakereséssel, míg az összes Spark-kód továbbra is fut a fürtben a távoli Azure Databricks-munkaterületen. Az alapvető Spark-motorkódot nem lehet közvetlenül az ügyfélből hibakeresésre használni.

  7. A JupyterLab leállításához kattintson a Fájl > leállítása elemre. Ha a JupyterLab-folyamat továbbra is fut a terminálban vagy a parancssorban, állítsa le ezt a folyamatot a megerősítéshez nyomja Ctrl + c le, majd írja be y .

Részletesebb hibakeresési utasításokért lásd : Hibakereső.