Sdílet prostřednictvím


Použití JupyterLabu s Databricks Connect pro Python

Poznámka:

Tento článek popisuje Databricks Connect pro Databricks Runtime 13.3 LTS a vyšší.

Tento článek popisuje, jak používat Databricks Connect pro Python s JupyterLabem. Databricks Connect umožňuje připojit oblíbené servery poznámkových bloků, prostředí IDE a další vlastní aplikace ke clusterům Azure Databricks. Podívejte se, co je Databricks Connect?

Poznámka:

Než začnete používat Databricks Connect, musíte nastavit klienta Databricks Connect.

Pokud chcete používat Databricks Connect s JupyterLabem a Pythonem, postupujte podle těchto pokynů.

  1. Pokud chcete nainstalovat JupyterLab s aktivovaným virtuálním prostředím Pythonu, spusťte z terminálu nebo příkazového řádku následující příkaz:

    pip3 install jupyterlab
    
  2. Pokud chcete spustit JupyterLab ve webovém prohlížeči, spusťte z aktivovaného virtuálního prostředí Pythonu následující příkaz:

    jupyter lab
    

    Pokud se JupyterLab nezobrazí ve webovém prohlížeči, zkopírujte adresu URL, která začíná vaším virtuálním prostředím localhost , 127.0.0.1 a zadejte ji do adresního řádku webového prohlížeče.

  3. Vytvořte nový poznámkový blok: v JupyterLabu klikněte v hlavní nabídce na Soubor nový poznámkový blok, vyberte Python 3 (ipykernel) a klikněte na Vybrat.> >

  4. Do první buňky poznámkového bloku zadejte ukázkový kód nebo vlastní kód. Pokud používáte vlastní kód, musíte minimálně inicializovat DatabricksSession , jak je znázorněno v ukázkovém kódu.

  5. Pokud chcete poznámkový blok spustit, klikněte na Spustit > všechny buňky. Veškerý kód běží místně, zatímco veškerý kód zahrnující operace datového rámce běží v clusteru ve vzdáleném pracovním prostoru Azure Databricks a odpovědi na spuštění se odešlou zpět místnímu volajícímu.

  6. Pokud chcete poznámkový blok ladit, klikněte na ikonu chyby (Povolit ladicí program) vedle Pythonu 3 (ipykernel) na panelu nástrojů poznámkového bloku. Nastavte jednu nebo více zarážek a klepněte na tlačítko Spustit > všechny buňky. Veškerý kód je laděný místně, zatímco veškerý kód Sparku se bude dál spouštět v clusteru ve vzdáleném pracovním prostoru Azure Databricks. Základní kód modulu Spark nelze ladit přímo z klienta.

  7. Chcete-li vypnout JupyterLab, klepněte na tlačítko Soubor > vypnout. Pokud proces JupyterLab stále běží v terminálu nebo příkazovém řádku, ukončete tento proces stisknutím Ctrl + c a zadáním potvrďte y .

Konkrétnější pokyny pro ladění najdete v tématu Ladicí program.