A JupyterLab használata a Pythonhoz készült Databricks Csatlakozás használatával
Megjegyzés:
Ez a cikk a Databricks Runtime 13.0-s és újabb verziókhoz készült Databricks Csatlakozás ismerteti.
Ez a cikk bemutatja, hogyan használható a Databricks Csatlakozás Pythonhoz a JupyterLab használatával. A Databricks Csatlakozás lehetővé teszi népszerű notebookkiszolgálók, azonosítók és egyéb egyéni alkalmazások Azure Databricks-fürtökhöz való csatlakoztatását. Lásd: Mi az a Databricks Csatlakozás?.
Megjegyzés:
A Databricks Csatlakozás használatának megkezdése előtt be kell állítania a Databricks Csatlakozás-ügyfelet.
A Databricks Csatlakozás a JupyterLab és a Python használatával való használatához kövesse az alábbi utasításokat.
A JupyterLab telepítéséhez a Python virtuális környezet aktiválásával futtassa a következő parancsot a terminálból vagy a parancssorból:
pip3 install jupyterlab
A JupyterLab webböngészőben való elindításához futtassa az alábbi parancsot az aktivált Python virtuális környezetből:
jupyter lab
Ha a JupyterLab nem jelenik meg a webböngészőben, másolja ki a virtuális környezetből kiinduló
localhost
VAGY127.0.0.1
onnan származó URL-címet, és írja be a webböngésző címsorába.Hozzon létre egy új jegyzetfüzetet: a JupyterLab-ban kattintson a főmenü Új > jegyzetfüzet fájlja > elemére, válassza a Python 3 (ipykernel) lehetőséget, majd kattintson a Kiválasztás gombra.
A jegyzetfüzet első cellájába írja be a példakódot vagy a saját kódját. Ha saját kódot használ, legalább inicializálnia
DatabricksSession
kell a példakódban látható módon.A jegyzetfüzet futtatásához kattintson az Összes cella futtatása parancsra>. Az összes kód helyileg fut, míg a DataFrame-műveleteket tartalmazó összes kód a távoli Azure Databricks-munkaterület fürtjén fut, és a futtatási válaszok vissza lesznek küldve a helyi hívónak.
A jegyzetfüzet hibakereséséhez kattintson a Python 3 (ipykernel) melletti hiba (Hibakereső engedélyezése) ikonra a jegyzetfüzet eszköztárában. Állítson be egy vagy több töréspontot, majd kattintson az Összes cella futtatása parancsra>. Az összes kód helyileg van hibakereséssel, míg az összes Spark-kód továbbra is fut a fürtben a távoli Azure Databricks-munkaterületen. Az alapvető Spark-motorkódot nem lehet közvetlenül az ügyfélből hibakeresésre használni.
A JupyterLab leállításához kattintson a Fájl > leállítása elemre. Ha a JupyterLab-folyamat továbbra is fut a terminálban vagy a parancssorban, állítsa le ezt a folyamatot a megerősítéshez nyomja
Ctrl + c
le, majd írja bey
.
Részletesebb hibakeresési utasításokért lásd : Hibakereső.