搭配適用於 Python 的 Databricks Connect 使用 JupyterLab
注意
本文涵蓋 Databricks Runtime 13.3 LTS 和更新版本適用的 Databricks Connect。
本文說明如何搭配 JupyterLab 使用 Databricks Connect for Python。 Databricks Connect 可讓您將熱門筆記本伺服器、IDE 和其他自定義應用程式連線到 Azure Databricks 叢集。 請參閱 什麼是 Databricks Connect?。
注意
開始使用 Databricks Connect 之前,您必須先 設定 Databricks Connect 用戶端。
若要使用 Databricks Connect 與 JupyterLab 和 Python,請遵循這些指示。
若要安裝 JupyterLab,請啟動 Python 虛擬環境,從終端機或命令提示字元執行下列命令:
pip3 install jupyterlab
若要在網頁瀏覽器中啟動 JupyterLab,請從您啟動的 Python 虛擬環境執行下列命令:
jupyter lab
如果 JupyterLab 未出現在網頁瀏覽器中,請複製開頭
localhost
為 虛擬127.0.0.1
環境的 URL,然後在網頁瀏覽器的網址列中輸入它。建立新的筆記本:在 JupyterLab 中,單擊 主功能表上的 [檔案 > 新 > 筆記本 ],選取 [Python 3][ipykernel], 然後按兩下 [ 選取]。
在筆記本的第一個數據格中 ,輸入範例程式代碼或您自己的程序代碼 。 如果您使用自己的程式代碼,您至少必須初始化
DatabricksSession
,如範例程式代碼所示。若要執行筆記本,請按兩下 [ 執行 > 所有儲存格]。 所有程式代碼都會在本機執行,而涉及 DataFrame 作業的所有程式代碼都會在遠端 Azure Databricks 工作區的叢集上執行,並執行回應會傳回給本機呼叫端。
若要偵錯筆記本,請按下筆記本工具列中 Python 3 (ipykernel) 旁的 Bug (啟用調試程式) 圖示。 設定一或多個斷點,然後按下 [ 執行 > 所有單元格]。 所有程式代碼都會在本機偵錯,而所有Spark程式代碼都會繼續在遠端 Azure Databricks 工作區中的叢集上執行。 核心 Spark 引擎程式代碼無法直接從客戶端進行偵錯。
若要關閉 JupyterLab,請按兩下 [ 檔案 > 關機]。 如果 JupyterLab 進程仍在終端機或命令提示字元中執行,請按
Ctrl + c
,然後輸入y
以確認來停止此程式。
如需更具體的偵錯指示,請參閱 調試程式。