Sdílet prostřednictvím


Použití klasického poznámkového bloku Jupyter s Databricks Connect pro Python

Poznámka:

Tento článek popisuje Databricks Connect pro Databricks Runtime 13.3 LTS a vyšší.

Tento článek popisuje, jak používat Databricks Connect pro Python s klasickým poznámkovým blokem Jupyter. Databricks Connect umožňuje připojit oblíbené servery poznámkových bloků, prostředí IDE a další vlastní aplikace ke clusterům Azure Databricks. Podívejte se, co je Databricks Connect?

Poznámka:

Než začnete používat Databricks Connect, musíte nastavit klienta Databricks Connect.

Pokud chcete používat Databricks Connect s klasickým poznámkovým blokem Jupyter a Pythonem, postupujte podle těchto pokynů.

  1. Pokud chcete nainstalovat klasický Jupyter Notebook, aktivované virtuální prostředí Pythonu, spusťte z terminálu nebo příkazového řádku následující příkaz:

    pip3 install notebook
    
  2. Pokud chcete spustit klasický jupyter Notebook ve webovém prohlížeči, spusťte z aktivovaného virtuálního prostředí Pythonu následující příkaz:

    jupyter notebook
    

    Pokud se klasický poznámkový blok Jupyter ve webovém prohlížeči nezobrazuje, zkopírujte adresu URL, která začíná vaším virtuálním prostředím localhost , 127.0.0.1 a zadejte ji do adresního řádku webového prohlížeče.

  3. Vytvořte nový poznámkový blok: v klasickém Poznámkovém bloku Jupyter klikněte na kartě Soubory na Nový > Python 3 (ipykernel).

  4. Do první buňky poznámkového bloku zadejte ukázkový kód nebo vlastní kód. Pokud používáte vlastní kód, musíte minimálně inicializovat DatabricksSession , jak je znázorněno v ukázkovém kódu.

  5. Pokud chcete poznámkový blok spustit, klikněte na tlačítko Spustit vše v buňce>. Veškerý kód Pythonu běží místně, zatímco veškerý kód PySpark zahrnující operace datového rámce běží v clusteru ve vzdáleném pracovním prostoru Azure Databricks a odpovědi na spuštění se odešlou zpět do místního volajícího.

  6. Pokud chcete poznámkový blok ladit, přidejte na začátek poznámkového bloku následující řádek kódu:

    from IPython.core.debugger import set_trace

    Potom voláním set_trace() zadejte příkazy ladění v tomto okamžiku provádění poznámkového bloku. Veškerý kód Pythonu je laděný místně, zatímco veškerý kód PySpark se bude dál spouštět v clusteru ve vzdáleném pracovním prostoru Azure Databricks. Základní kód modulu Spark nelze ladit přímo z klienta.

  7. Pokud chcete klasický poznámkový blok Jupyter Vypnout, klikněte na > Tlačítko Zavřít a Zastavit soubor. Pokud klasický proces Jupyter Notebook stále běží v terminálu nebo příkazovém řádku, ukončete tento proces stisknutím Ctrl + c a zadáním potvrďte y .