Sdílet prostřednictvím


Konfigurace projektu Databricks pomocí rozšíření Databricks pro Visual Studio Code

Rozšíření Databricks pro Visual Studio Code nabízí zobrazení konfigurace na panelu rozšíření, které umožňuje snadno konfigurovat a aktualizovat nastavení pro váš projekt Databricks. Mezi tyto funkce patří selektor nasazení cílového pracovního prostoru, snadná konfigurace ověřování a výpočetních prostředků, synchronizace složek pracovního prostoru a jednoduché kroky pro aktivaci virtuálního prostředí Pythonu potřebného k ladění.

Zobrazení Konfigurace v rozšíření Databricks pro Visual Studio Code je k dispozici po vytvoření nebo migraci projektu do projektu Databricks. Viz Vytvoření nového projektu Databricks.

Poznámka:

Dřívější verze rozšíření Databricks pro Visual Studio Code definovaly nastavení konfigurace v souboru JSON projektu a proměnných prostředí byly nastaveny v terminálu. Ve verzi vydané verze se v souborech a souborech databricks.yml nachází konfigurace projektu a databricks.env prostředí.

Pokud je vaším projektem sada prostředků Databricks, poskytuje uživatelské rozhraní rozsahu Databricks také Průzkumník prostředků sady prostředků a zobrazení proměnných sady pro správu prostředků a proměnných sady prostředků. Viz funkce rozšíření Sady prostředků Databricks.

Změna pracovního prostoru cílového nasazení

Výběr nebo přepnutí cíle nasazení pro váš projekt Databricks (například přepnutí z dev cíle na prod cíl):

  1. V zobrazení konfigurace na panelu rozšíření Databricks klikněte na ikonu ozubeného kola (Vyberte cíl sady prostředků Databricks) přidruženou k cíli.

    Výběr cíle sady prostředků Databricks

  2. Na paletě příkazů vyberte požadovaný cíl nasazení.

Po nakonfigurování cíle se zobrazí režim hostitele a nasazení. Informace o režimech nasazení Sady prostředků Databricks najdete v tématu Režimy nasazení sady prostředků Databricks.

Hostitele pracovního prostoru lze změnit úpravou cílového workspace nastavení v konfiguračním databricks.yml souboru přidruženém k projektu. Podívejte se na cíle.

Poznámka:

Následující rozšíření Databricks pro funkce editoru Visual Studio Code jsou k dispozici pouze v případě, že je vývoj v cílovém režimu nasazení:

  • Použití připojeného vývojového clusteru pro úlohy sady prostředků
  • Synchronizace souborů složek pracovního prostoru
  • Výběr interaktivního vývojového clusteru

Konfigurace profilu Databricks pro projekt

Když vytvoříte projekt Databricks nebo migrujete projekt, který bude projektem Databricks, nakonfigurujete profil, který zahrnuje nastavení ověřování používané pro připojení k Databricks. Pokud chcete změnit použitý profil ověřování, klikněte v zobrazení Konfigurace na ikonu ozubeného kola přidruženou k AuthType.

Další informace o rozšíření Databricks pro ověřování editoru Visual Studio Code najdete v tématu Nastavení ověřování pro rozšíření Databricks pro Visual Studio Code.

Výběr clusteru pro spouštění kódu a úloh

Pomocí rozšíření Databricks pro Visual Studio Code můžete vybrat existující cluster Azure Databricks nebo vytvořit nový cluster Azure Databricks pro spouštění kódu a úloh. Jakmile se připojíte k výpočetním prostředkům, zobrazí se ID clusteru, verze Databricks Runtime, tvůrce, stav a režim přístupu. Cluster můžete také spustit a zastavit a přejít přímo na podrobnosti stránky clusteru.

Tip

Pokud nechcete čekat, až se cluster úloh spustí, zkontrolujte cluster Přepsání úloh v sadě těsně pod výběrem clusteru a použijte vybraný cluster pro spouštění úloh sady ve vývojovém režimu.

Použití existujícího clusteru

Pokud máte existující cluster Azure Databricks, který chcete použít:

  1. V zobrazení Konfigurace vedle clusteru klepněte na tlačítko Vybrat cluster nebo ikonu ozubeného kola (Konfigurovat cluster).

    Konfigurace clusteru

  2. V paletě příkazů vyberte cluster, který chcete použít.

Vytvoření nového clusteru

Pokud nemáte existující cluster Azure Databricks nebo chcete vytvořit nový cluster:

  1. V zobrazení Konfigurace vedle clusteru klikněte na ikonu ozubeného kola (Konfigurovat cluster).

  2. Na paletě příkazů klikněte na Vytvořit nový cluster.

  3. Po zobrazení výzvy k otevření externího webu (pracovního prostoru Azure Databricks) klikněte na Otevřít.

  4. Pokud se zobrazí výzva, přihlaste se k pracovnímu prostoru Azure Databricks.

  5. Podle pokynů vytvořte cluster.

    Poznámka:

    Databricks doporučuje vytvořit osobní výpočetní cluster. Díky tomu můžete okamžitě začít spouštět úlohy, což minimalizuje režijní náklady na správu výpočetních prostředků.

  6. Po vytvoření a spuštění clusteru se vraťte do editoru Visual Studio Code.

  7. V zobrazení Konfigurace vedle clusteru klikněte na ikonu ozubeného kola (Konfigurovat cluster).

    Konfigurace ikony clusteru 3

    V paletě příkazů klikněte na cluster, který chcete použít.

Synchronizace složky pracovního prostoru s Databricks

Vzdálenou složku pracovního prostoru Databricks přidruženou k projektu Databricks můžete synchronizovat kliknutím na ikonu synchronizace (Spustit synchronizaci) přidruženou ke složce pracovního prostoru v zobrazení Konfigurace na panelu rozšíření Databricks.

Poznámka:

Rozšíření Databricks pro Visual Studio Code funguje jenom s adresáři pracovních prostorů, které vytvoří. Existující adresář pracovního prostoru v projektu nelze použít, pokud ho rozšíření nevytvořilo.

Pokud chcete přejít do zobrazení pracovního prostoru v Databricks, klikněte na ikonu externího odkazu (Otevřít odkaz externě) přidruženou ke složce pracovního prostoru.

Rozšíření určuje složku pracovního prostoru Azure Databricks, která se má použít, na file_path základě nastavení v workspace mapování přidružené konfigurace sady prostředků Databricks projektu. Viz pracovní prostor.

Poznámka:

Rozšíření Databricks pro Visual Studio Code provádí jenom jednosměrnou automatickou synchronizaci změn souborů z místního projektu editoru Visual Studio Code do související složky pracovního prostoru ve vzdáleném pracovním prostoru Azure Databricks. Soubory v tomto adresáři vzdáleného pracovního prostoru jsou určené jako přechodné. Nespouštět změny těchto souborů ze vzdáleného pracovního prostoru, protože tyto změny nebudou synchronizovány zpět do místního projektu.

Podrobnosti o využití funkce synchronizace adresáře pracovního prostoru pro starší verze rozšíření Databricks pro Visual Studio Code najdete v tématu Výběr adresáře pracovního prostoru pro rozšíření Databricks pro Visual Studio Code.

Nastavení prostředí Pythonu a Databricks Connect

Část Prostředí Pythonu v zobrazení Konfigurace umožňuje snadnou instalaci virtuálního vývojového prostředí Pythonu a instalaci služby Databricks Connect pro spouštění a ladění kódu a buněk poznámkového bloku. Virtuální prostředí Pythonu zajišťují, že váš projekt používá kompatibilní verze balíčků Pythonu a Pythonu (v tomto případě balíček Databricks Connect).

Pokud chcete pro svůj projekt nakonfigurovat virtuální prostředí Pythonu, v zobrazení Konfigurace na panelu rozšíření:

  1. V části Python Environment klikněte na červenou položku Aktivovat virtuální prostředí.
  2. V paletě příkazů vyberte Venv nebo Conda.
  3. Vyberte závislosti, které chcete nainstalovat, pokud existují.

Pokud chcete změnit prostředí, klikněte na ikonu ozubeného kola (Změnit virtuální prostředí) přidruženou k aktivnímu prostředí.

Informace o instalaci Databricks Connect, která umožňuje spouštění a ladění kódu a poznámkových bloků v nástroji Visual Studio Code, najdete v tématu Ladění kódu pomocí Databricks Connect pro rozšíření Databricks pro Visual Studio Code.