Použití klasického poznámkového bloku Jupyter s Databricks Connect pro Python

Článek
07/16/2024

Poznámka:

Tento článek popisuje Databricks Connect pro Databricks Runtime 13.3 LTS a vyšší.

Tento článek popisuje, jak používat Databricks Connect pro Python s klasickým poznámkovým blokem Jupyter. Databricks Connect umožňuje připojit oblíbené servery poznámkových bloků, prostředí IDE a další vlastní aplikace ke clusterům Azure Databricks. Podívejte se, co je Databricks Connect?

Poznámka:

Než začnete používat Databricks Connect, musíte nastavit klienta Databricks Connect.

Pokud chcete používat Databricks Connect s klasickým poznámkovým blokem Jupyter a Pythonem, postupujte podle těchto pokynů.

Pokud chcete nainstalovat klasický Jupyter Notebook, aktivované virtuální prostředí Pythonu, spusťte z terminálu nebo příkazového řádku následující příkaz:
```
pip3 install notebook
```
Pokud chcete spustit klasický jupyter Notebook ve webovém prohlížeči, spusťte z aktivovaného virtuálního prostředí Pythonu následující příkaz:
```
jupyter notebook
```
Pokud se klasický poznámkový blok Jupyter ve webovém prohlížeči nezobrazuje, zkopírujte adresu URL, která začíná vaším virtuálním prostředím localhost , 127.0.0.1 a zadejte ji do adresního řádku webového prohlížeče.
Vytvořte nový poznámkový blok: v klasickém Poznámkovém bloku Jupyter klikněte na kartě Soubory na Nový > Python 3 (ipykernel).
Do první buňky poznámkového bloku zadejte ukázkový kód nebo vlastní kód. Pokud používáte vlastní kód, musíte minimálně inicializovat DatabricksSession , jak je znázorněno v ukázkovém kódu.
Pokud chcete poznámkový blok spustit, klikněte na tlačítko Spustit vše v buňce>. Veškerý kód Pythonu běží místně, zatímco veškerý kód PySpark zahrnující operace datového rámce běží v clusteru ve vzdáleném pracovním prostoru Azure Databricks a odpovědi na spuštění se odešlou zpět do místního volajícího.
Pokud chcete poznámkový blok ladit, přidejte na začátek poznámkového bloku následující řádek kódu:

from IPython.core.debugger import set_trace

Potom voláním set_trace() zadejte příkazy ladění v tomto okamžiku provádění poznámkového bloku. Veškerý kód Pythonu je laděný místně, zatímco veškerý kód PySpark se bude dál spouštět v clusteru ve vzdáleném pracovním prostoru Azure Databricks. Základní kód modulu Spark nelze ladit přímo z klienta.
Pokud chcete klasický poznámkový blok Jupyter Vypnout, klikněte na > Tlačítko Zavřít a Zastavit soubor. Pokud klasický proces Jupyter Notebook stále běží v terminálu nebo příkazovém řádku, ukončete tento proces stisknutím Ctrl + c a zadáním potvrďte y .

Sdílet prostřednictvím

Použití klasického poznámkového bloku Jupyter s Databricks Connect pro Python

Váš názor

Další materiály