Sdílet prostřednictvím


Konfigurace projektu Databricks pomocí rozšíření Databricks pro Visual Studio Code

Rozšíření Databricks pro Visual Studio Code nabízí zobrazení konfigurace na panelu rozšíření, které umožňuje snadno konfigurovat a aktualizovat nastavení pro váš projekt Databricks. Mezi tyto funkce patří selektor nasazení cílového pracovního prostoru, snadná konfigurace ověřování a výpočetních prostředků, synchronizace složek pracovního prostoru a jednoduché kroky pro aktivaci virtuálního prostředí Pythonu potřebného k ladění.

Zobrazení Konfigurace v rozšíření Databricks pro Visual Studio Code je k dispozici po vytvoření nebo migraci projektu do projektu Databricks. Viz Vytvoření nového projektu Databricks.

Poznámka:

Dřívější verze rozšíření Databricks pro Visual Studio Code definovaly nastavení konfigurace v souboru JSON projektu a proměnných prostředí byly nastaveny v terminálu. Ve verzi vydané verze se v souborech a souborech databricks.yml nachází konfigurace projektu a databricks.env prostředí.

Pokud je vaším projektem sada prostředků Databricks, poskytuje uživatelské rozhraní rozsahu Databricks také Průzkumník prostředků sady prostředků a zobrazení proměnných sady pro správu prostředků a proměnných sady prostředků. Viz funkce rozšíření Sady prostředků Databricks.

Změna pracovního prostoru cílového nasazení

Výběr nebo přepnutí cíle nasazení pro váš projekt Databricks (například přepnutí z dev cíle na prod cíl):

  1. V zobrazení konfigurace na panelu rozšíření Databricks klikněte na ikonu ozubeného kola (Vyberte cíl sady prostředků Databricks) přidruženou k cíli.

    Výběr cíle sady prostředků Databricks

  2. Na paletě příkazů vyberte požadovaný cíl nasazení.

Po nakonfigurování cíle se zobrazí režim hostitele a nasazení. Informace o režimech nasazení Sady prostředků Databricks najdete v tématu Režimy nasazení sady prostředků Databricks.

Hostitele pracovního prostoru lze změnit úpravou cílového workspace nastavení v konfiguračním databricks.yml souboru přidruženém k projektu. Podívejte se na cíle.

Poznámka:

Následující rozšíření Databricks pro funkce editoru Visual Studio Code jsou k dispozici pouze v případě, že je vývoj v cílovém režimu nasazení:

  • Použití připojeného vývojového clusteru pro úlohy sady prostředků
  • Synchronizace souborů složek pracovního prostoru
  • Výběr interaktivního vývojového clusteru

Konfigurace profilu Databricks pro projekt

Když vytvoříte projekt Databricks nebo převedete projekt na projekt Databricks, nakonfigurujete profil, který zahrnuje nastavení ověřování používané pro připojení k Databricks. Pokud chcete změnit použitý profil ověřování, klikněte v zobrazení Konfigurace na ikonu ozubeného kola přidruženou k AuthType.

Další informace o rozšíření Databricks pro ověřování editoru Visual Studio Code najdete v tématu Nastavení autorizace pro rozšíření Databricks pro Visual Studio Code.

Výběr výpočetních prostředků pro spouštění kódu a úloh

Pomocí rozšíření Databricks pro Visual Studio Code můžete vybrat bezserverový cluster, vybrat existující cluster Azure Databricks nebo vytvořit nový cluster Azure Databricks pro spouštění kódu a úloh. Po připojení k výpočetním prostředkům se zobrazí ID clusteru, verze Databricks Runtime, tvůrce, stav a režim přístupu. Můžete také spustit a zastavit cluster a přejít přímo na podrobnosti stránky clusteru.

Návod

Pokud nechcete čekat, až se cluster úloh spustí, zaškrtněte Přepsat cluster úloh v sadě těsně pod výběrem clusteru, abyste použili vybraný cluster pro spuštění úloh balíčku ve vývojovém módu. Tato možnost není dostupná, pokud používáte výpočetní prostředky bez serveru.

Použití bezserverové architektury

Bezserverové výpočetní prostředky spravuje Azure Databricks. Když spouštíte úlohy na bezserverových výpočetních prostředcích, Azure Databricks automaticky přidělí a spravuje potřebné výpočetní prostředky.

  1. V zobrazení Konfigurace vedle clusteru klepněte na tlačítko Vybrat cluster nebo ikonu ozubeného kola (Konfigurovat cluster).

    Konfigurace clusteru

  2. Na paletě příkazů vyberte Bezserverové.

    Výběr výpočetních prostředků bez serveru

Použití existujícího clusteru

Pokud máte existující cluster Azure Databricks, který chcete použít:

  1. V zobrazení Konfigurace vedle clusteru klepněte na tlačítko Vybrat cluster nebo ikonu ozubeného kola (Konfigurovat cluster).

  2. V paletě příkazů vyberte cluster, který chcete použít.

Vytvoření nového clusteru

Pokud nemáte existující cluster Azure Databricks nebo chcete vytvořit nový cluster:

  1. V zobrazení Konfigurace vedle clusteru klikněte na ikonu ozubeného kola (Konfigurovat cluster).

  2. Na paletě příkazů klikněte na Vytvořit nový cluster.

  3. Po zobrazení výzvy k otevření externího webu (pracovního prostoru Azure Databricks) klikněte na Otevřít.

  4. Pokud se zobrazí výzva, přihlaste se k pracovnímu prostoru Azure Databricks.

  5. Podle pokynů vytvořte cluster.

    Poznámka:

    Databricks doporučuje vytvořit osobní výpočetní cluster. Díky tomu můžete okamžitě začít spouštět úlohy, což minimalizuje režijní náklady na správu výpočetních prostředků.

  6. Po vytvoření a spuštění clusteru se vraťte do editoru Visual Studio Code.

  7. V zobrazení Konfigurace vedle clusteru klikněte na ikonu ozubeného kola (Konfigurovat cluster).

    Konfigurace ikony clusteru 3

    V paletě příkazů klikněte na cluster, který chcete použít.

Synchronizace složky pracovního prostoru s Databricks

Vzdálenou složku pracovního prostoru Databricks přidruženou k projektu Databricks můžete synchronizovat kliknutím na ikonu synchronizace (Spustit synchronizaci) přidruženou k vzdálené složce v zobrazení konfigurace zobrazení panelu rozšíření Databricks.

Poznámka:

Rozšíření Databricks pro Visual Studio Code funguje jenom s adresáři pracovních prostorů, které vytvoří. Existující adresář pracovního prostoru v projektu nelze použít, pokud ho rozšíření nevytvořilo.

Pokud chcete přejít do zobrazení pracovního prostoru v Databricks, klikněte na ikonu externího odkazu (Otevřít odkaz externě) přidruženou k vzdálené složce.

Rozšíření určuje složku pracovního prostoru Azure Databricks, která se má použít na základě nastavení file_path v mapování konfigurace balíčku prostředků Databricks přidruženého k projektu workspace. Viz pracovní prostor.

Poznámka:

Rozšíření Databricks pro Visual Studio Code provádí jenom jednosměrnou automatickou synchronizaci změn souborů z místního projektu editoru Visual Studio Code do související složky pracovního prostoru ve vzdáleném pracovním prostoru Azure Databricks. Soubory v tomto adresáři vzdáleného pracovního prostoru jsou určené jako přechodné. Nespouštět změny těchto souborů ze vzdáleného pracovního prostoru, protože tyto změny nebudou synchronizovány zpět do místního projektu.

Podrobnosti o využití funkce synchronizace adresáře pracovního prostoru pro starší verze rozšíření Databricks pro Visual Studio Code najdete v tématu Výběr adresáře pracovního prostoru pro rozšíření Databricks pro Visual Studio Code.

Nastavení prostředí Pythonu a Databricks Connect

Část Prostředí Pythonu v zobrazení Konfigurace umožňuje snadnou instalaci virtuálního vývojového prostředí Pythonu a instalaci služby Databricks Connect pro spouštění a ladění kódu a buněk poznámkového bloku. Virtuální prostředí Pythonu zajišťují, že váš projekt používá kompatibilní verze balíčků Pythonu a Pythonu (v tomto případě balíček Databricks Connect).

Pokud chcete pro svůj projekt nakonfigurovat virtuální prostředí Pythonu, v zobrazení Konfigurace na panelu rozšíření:

  1. V části Python Environment klikněte na červenou položku Aktivovat virtuální prostředí.
  2. V paletě příkazů vyberte Venv nebo Conda.
  3. Vyberte závislosti, které chcete nainstalovat, pokud existují.

Pokud chcete změnit prostředí, klikněte na ikonu ozubeného kola (Změnit virtuální prostředí) přidruženou k aktivnímu prostředí.

Informace o instalaci Databricks Connect, která umožňuje spouštění a ladění kódu a poznámkových bloků v nástroji Visual Studio Code, najdete v tématu Ladění kódu pomocí Databricks Connect pro rozšíření Databricks pro Visual Studio Code.