Konfigurace clusteru pro Databricks Connect
Poznámka:
Tento článek popisuje Databricks Connect pro Databricks Runtime 13.3 LTS a vyšší.
Tento článek obsahuje seznam nastavení konfigurace pro výpočetní prostředky Azure Databricks vyžadované pro připojení databricks Connect k nim. Tyto informace platí pro verzi Pythonu a Scala Databricks Connect, pokud není uvedeno jinak.
Databricks Connect umožňuje připojit oblíbené integrované vývojové prostředí (IDE), jako jsou Visual Studio Code, PyCharm, RStudio Desktop, IntelliJ IDEA, servery poznámkových bloků a další vlastní aplikace, ke clusterům Azure Databricks. Podívejte se, co je Databricks Connect?
Požadavky
- Účet a pracovní prostor Azure Databricks s povoleným katalogem Unity Viz Nastavení a správa katalogu Unity a povolení pracovního prostoru pro Katalog Unity.
- Cluster Azure Databricks s nainstalovaným Modulem Databricks Runtime 13.3 LTS nebo novějším
- Verze databricks Runtime vašeho clusteru musí být stejná nebo vyšší než verze balíčku Databricks Connect. Databricks doporučuje použít nejnovější balíček Databricks Connect, který odpovídá verzi Databricks Runtime. Pokud chcete používat funkce, které jsou k dispozici v novějších verzích databricks Runtime, musíte upgradovat balíček Databricks Connect. Seznam dostupných verzí Databricks Connect najdete v poznámkách k verzi Databricks Connect. Poznámky k verzi verze Databricks Runtime najdete v poznámkách k verzi databricks Runtime a jejich kompatibilitu.
- Cluster musí používat režim přístupu ke clusteru s přiřazeným nebo sdíleným režimem. Viz režimy Accessu.
Programové ověřování
Ve službě Databricks Connect 14.3 a novějších DatabricksSession.builder
verzích validateSession
se zavádí řada ověření, která zajistí splnění předchozích požadavků.
V Databricks Connect pro Python databricks-connect
má test
binární podpříkaz, který provádí stejnou sadu ověření.
Tento příkaz by se měl spustit v terminálu s aktivním prostředím Pythonu, které zahrnuje Databricks Connect, a s nakonfigurovanou sadou výchozích přihlašovacích údajů. Informace o konfiguraci těchto přihlašovacích údajů najdete v tématu Konfigurace vlastností připojení.
databricks-connect test
Příkaz selže s nenulovým ukončovacím kódem a příslušnou zprávou v případě, že některý z požadavků není splněn.
Zakázání služby Databricks Connect
Databricks Connect (a základní služby Spark Connect) je možné zakázat v jakémkoli daném clusteru.
Pokud chcete zakázat službu Databricks Connect, nastavte v clusteru následující konfiguraci Sparku.
spark.databricks.service.server.enabled false
Další kroky
- Informace o Pythonu najdete v tématu Instalace databricks Connect pro Python.
- Informace o jazyce R najdete v tématu Databricks Connect pro R.
- Informace o scala najdete v tématu Instalace Databricks Connect pro Scala.