Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Poznámka
Tento článek popisuje Databricks Connect pro Databricks Runtime 13.3 LTS a novější.
Tento článek popisuje, jak používat nástroje Databricks Utilities se službou Databricks Connect pro Python. Databricks Connect umožňuje připojit oblíbená prostředí IDE, servery poznámkových bloků a vlastní aplikace ke clusterům Azure Databricks. Viz Databricks Connect.
Než začnete používat Databricks Connect, musíte nastavit klienta Databricks Connect.
Pro verzi článku určenou pro Scala nahlédněte do Databricks Utilities s Databricks Connect pro Scala.
Dostupné nástroje Databricks
Databricks Connect používáte pro přístup k nástrojům Databricks následujícím způsobem:
-
WorkspaceClientPro přístup k nástrojům Databricks použijte proměnnou třídydbutils. TřídaWorkspaceClientpatří do sady Databricks SDK pro Python a je součástí databricks Connect. - Použijte
dbutils.fspro přístup k nástroji Databricks Utilities fs. - K přístupu k utility
dbutils.secretsv Databricks Utilities použijte nástroj secrets.
Žádné další funkce utility Databricks kromě předchozích nejsou k dispozici prostřednictvím dbutils.
Spropitné
Zahrnutou sadu Databricks SDK můžete také použít pro Python pro přístup k libovolnému dostupnému rozhraní DATAbricks REST API, nejen k předchozím rozhraním API pro nástroje Databricks. Viz databricks-sdk na PyPI.
Inicializujte klienta pracovního prostoru
Pokud chcete inicializovat WorkspaceClient, musíte zadat dostatek informací k ověření sady SDK Databricks v pracovním prostoru. Můžete například:
Pevně zakódujte adresu URL pracovního prostoru a přístupový token přímo v kódu a pak inicializujete
WorkspaceClientnásledujícím způsobem. I když je tato možnost podporovaná, databricks nedoporučuje tuto možnost, protože může zveřejnit citlivé informace, jako jsou přístupové tokeny, pokud je váš kód vrácený do správy verzí nebo jinak sdílený:from databricks.sdk import WorkspaceClient w = WorkspaceClient(host = f"https://{retrieve_workspace_instance_name()}", token = retrieve_token())Vytvořte nebo zadejte konfigurační profil , který obsahuje pole
hostatoken, a poté inicializujteWorkspaceClientnásledujícím způsobem:from databricks.sdk import WorkspaceClient w = WorkspaceClient(profile = "<profile-name>")Nastavte proměnné prostředí
DATABRICKS_HOSTaDATABRICKS_TOKENstejným způsobem, jakým je nastavíte pro Databricks Connect, a pak inicializujeteWorkspaceClientnásledujícím způsobem:from databricks.sdk import WorkspaceClient w = WorkspaceClient()
Sada Databricks SDK pro Python nerozpozná proměnnou prostředí SPARK_REMOTE pro Databricks Connect.
Další možnosti ověřování Azure Databricks pro sadu Databricks SDK pro Python a také postup inicializace AccountClient v sadách SDK Databricks pro přístup k dostupným rozhraním REST API Databricks na úrovni účtu místo na úrovni pracovního prostoru najdete v tématu databricks-sdk na PyPI.
Příklad: Vytvoření souboru ve svazku
Následující příklad ukazuje, jak pomocí sady Databricks SDK pro Python automatizovat nástroje Databricks. Tento příklad vytvoří soubor pojmenovaný zzz_hello.txt v cestě ke svazku Katalogu Unity v pracovním prostoru, přečte data ze souboru a pak soubor odstraní. Tento příklad předpokládá, že proměnné prostředí DATABRICKS_HOST a DATABRICKS_TOKEN již byly nastaveny:
from databricks.sdk import WorkspaceClient
w = WorkspaceClient()
file_path = "/Volumes/main/default/my-volume/zzz_hello.txt"
file_data = "Hello, Databricks!"
fs = w.dbutils.fs
fs.put(
file = file_path,
contents = file_data,
overwrite = True
)
print(fs.head(file_path))
fs.rm(file_path)
Viz také Interakce s dbutils v dokumentaci Databricks SDK pro Python.