Konfigurace projektu Databricks pomocí rozšíření Databricks pro Visual Studio Code
Rozšíření Databricks pro Visual Studio Code nabízí zobrazení konfigurace na panelu rozšíření, které umožňuje snadno konfigurovat a aktualizovat nastavení pro váš projekt Databricks. Mezi tyto funkce patří selektor nasazení cílového pracovního prostoru, snadná konfigurace ověřování a výpočetních prostředků, synchronizace složek pracovního prostoru a jednoduché kroky pro aktivaci virtuálního prostředí Pythonu potřebného k ladění.
Zobrazení Konfigurace v rozšíření Databricks pro Visual Studio Code je k dispozici po vytvoření nebo migraci projektu do projektu Databricks. Viz Vytvoření nového projektu Databricks.
Poznámka:
Dřívější verze rozšíření Databricks pro Visual Studio Code definovaly nastavení konfigurace v souboru JSON projektu a proměnných prostředí byly nastaveny v terminálu. Ve verzi vydané verze se v souborech a souborech databricks.yml
nachází konfigurace projektu a databricks.env
prostředí.
Pokud je vaším projektem sada prostředků Databricks, poskytuje uživatelské rozhraní rozsahu Databricks také Průzkumník prostředků sady prostředků a zobrazení proměnných sady pro správu prostředků a proměnných sady prostředků. Viz funkce rozšíření Sady prostředků Databricks.
Změna pracovního prostoru cílového nasazení
Výběr nebo přepnutí cíle nasazení pro váš projekt Databricks (například přepnutí z dev
cíle na prod
cíl):
V zobrazení konfigurace na panelu rozšíření Databricks klikněte na ikonu ozubeného kola (Vyberte cíl sady prostředků Databricks) přidruženou k cíli.
Na paletě příkazů vyberte požadovaný cíl nasazení.
Po nakonfigurování cíle se zobrazí režim hostitele a nasazení. Informace o režimech nasazení Sady prostředků Databricks najdete v tématu Režimy nasazení sady prostředků Databricks.
Hostitele pracovního prostoru lze změnit úpravou cílového workspace
nastavení v konfiguračním databricks.yml
souboru přidruženém k projektu. Podívejte se na cíle.
Poznámka:
Následující rozšíření Databricks pro funkce editoru Visual Studio Code jsou k dispozici pouze v případě, že je vývoj v cílovém režimu nasazení:
- Použití připojeného vývojového clusteru pro úlohy sady prostředků
- Synchronizace souborů složek pracovního prostoru
- Výběr interaktivního vývojového clusteru
Konfigurace profilu Databricks pro projekt
Když vytvoříte projekt Databricks nebo migrujete projekt, který bude projektem Databricks, nakonfigurujete profil, který zahrnuje nastavení ověřování používané pro připojení k Databricks. Pokud chcete změnit použitý profil ověřování, klikněte v zobrazení Konfigurace na ikonu ozubeného kola přidruženou k AuthType.
Další informace o rozšíření Databricks pro ověřování editoru Visual Studio Code najdete v tématu Nastavení ověřování pro rozšíření Databricks pro Visual Studio Code.
Výběr clusteru pro spouštění kódu a úloh
Pomocí rozšíření Databricks pro Visual Studio Code můžete vybrat existující cluster Azure Databricks nebo vytvořit nový cluster Azure Databricks pro spouštění kódu a úloh. Jakmile se připojíte k výpočetním prostředkům, zobrazí se ID clusteru, verze Databricks Runtime, tvůrce, stav a režim přístupu. Cluster můžete také spustit a zastavit a přejít přímo na podrobnosti stránky clusteru.
Tip
Pokud nechcete čekat, až se cluster úloh spustí, zkontrolujte cluster Přepsání úloh v sadě těsně pod výběrem clusteru a použijte vybraný cluster pro spouštění úloh sady ve vývojovém režimu.
Použití existujícího clusteru
Pokud máte existující cluster Azure Databricks, který chcete použít:
V zobrazení Konfigurace vedle clusteru klepněte na tlačítko Vybrat cluster nebo ikonu ozubeného kola (Konfigurovat cluster).
V paletě příkazů vyberte cluster, který chcete použít.
Vytvoření nového clusteru
Pokud nemáte existující cluster Azure Databricks nebo chcete vytvořit nový cluster:
V zobrazení Konfigurace vedle clusteru klikněte na ikonu ozubeného kola (Konfigurovat cluster).
Na paletě příkazů klikněte na Vytvořit nový cluster.
Po zobrazení výzvy k otevření externího webu (pracovního prostoru Azure Databricks) klikněte na Otevřít.
Pokud se zobrazí výzva, přihlaste se k pracovnímu prostoru Azure Databricks.
Podle pokynů vytvořte cluster.
Poznámka:
Databricks doporučuje vytvořit osobní výpočetní cluster. Díky tomu můžete okamžitě začít spouštět úlohy, což minimalizuje režijní náklady na správu výpočetních prostředků.
Po vytvoření a spuštění clusteru se vraťte do editoru Visual Studio Code.
V zobrazení Konfigurace vedle clusteru klikněte na ikonu ozubeného kola (Konfigurovat cluster).
V paletě příkazů klikněte na cluster, který chcete použít.
Synchronizace složky pracovního prostoru s Databricks
Vzdálenou složku pracovního prostoru Databricks přidruženou k projektu Databricks můžete synchronizovat kliknutím na ikonu synchronizace (Spustit synchronizaci) přidruženou ke složce pracovního prostoru v zobrazení Konfigurace na panelu rozšíření Databricks.
Poznámka:
Rozšíření Databricks pro Visual Studio Code funguje jenom s adresáři pracovních prostorů, které vytvoří. Existující adresář pracovního prostoru v projektu nelze použít, pokud ho rozšíření nevytvořilo.
Pokud chcete přejít do zobrazení pracovního prostoru v Databricks, klikněte na ikonu externího odkazu (Otevřít odkaz externě) přidruženou ke složce pracovního prostoru.
Rozšíření určuje složku pracovního prostoru Azure Databricks, která se má použít, na file_path
základě nastavení v workspace
mapování přidružené konfigurace sady prostředků Databricks projektu. Viz pracovní prostor.
Poznámka:
Rozšíření Databricks pro Visual Studio Code provádí jenom jednosměrnou automatickou synchronizaci změn souborů z místního projektu editoru Visual Studio Code do související složky pracovního prostoru ve vzdáleném pracovním prostoru Azure Databricks. Soubory v tomto adresáři vzdáleného pracovního prostoru jsou určené jako přechodné. Nespouštět změny těchto souborů ze vzdáleného pracovního prostoru, protože tyto změny nebudou synchronizovány zpět do místního projektu.
Podrobnosti o využití funkce synchronizace adresáře pracovního prostoru pro starší verze rozšíření Databricks pro Visual Studio Code najdete v tématu Výběr adresáře pracovního prostoru pro rozšíření Databricks pro Visual Studio Code.
Nastavení prostředí Pythonu a Databricks Connect
Část Prostředí Pythonu v zobrazení Konfigurace umožňuje snadnou instalaci virtuálního vývojového prostředí Pythonu a instalaci služby Databricks Connect pro spouštění a ladění kódu a buněk poznámkového bloku. Virtuální prostředí Pythonu zajišťují, že váš projekt používá kompatibilní verze balíčků Pythonu a Pythonu (v tomto případě balíček Databricks Connect).
Pokud chcete pro svůj projekt nakonfigurovat virtuální prostředí Pythonu, v zobrazení Konfigurace na panelu rozšíření:
- V části Python Environment klikněte na červenou položku Aktivovat virtuální prostředí.
- V paletě příkazů vyberte Venv nebo Conda.
- Vyberte závislosti, které chcete nainstalovat, pokud existují.
Pokud chcete změnit prostředí, klikněte na ikonu ozubeného kola (Změnit virtuální prostředí) přidruženou k aktivnímu prostředí.
Informace o instalaci Databricks Connect, která umožňuje spouštění a ladění kódu a poznámkových bloků v nástroji Visual Studio Code, najdete v tématu Ladění kódu pomocí Databricks Connect pro rozšíření Databricks pro Visual Studio Code.