Python için Databricks Bağlan ile Databricks Yardımcı Programları
Dekont
Bu makalede Databricks Runtime 13.0 ve üzeri için Databricks Bağlan yer alır.
Bu makalede, Databricks Utilities'in Python için Databricks Bağlan ile nasıl kullanılacağı açıklanmaktadır. Databricks Bağlan popüler IDE'leri, not defteri sunucularını ve özel uygulamaları Azure Databricks kümelerine bağlamanızı sağlar. Bkz. Databricks Bağlan nedir?. Bu makalenin Scala sürümü için bkz. Scala için Databricks Bağlan ile Databricks Yardımcı Programları.
Dekont
Databricks Bağlan kullanmaya başlamadan önce Databricks Bağlan istemcisini ayarlamanız gerekir.
Databricks Yardımcı Programları'na erişmek için Databricks Bağlan aşağıdaki gibi kullanırsınız:
WorkspaceClient
Databricks Yardımcı Programlarına erişmek için sınıfındbutils
değişkenini kullanın. sınıfı PythonWorkspaceClient
için Databricks SDK'sına aittir ve Databricks Bağlan'a dahildir.- Databricks Utilities fs yardımcı programı'na erişmek için kullanın
dbutils.fs
. - Databricks Utilities gizli dizileri yardımcı programı'na erişmek için kullanın
dbutils.secrets
. - önceki yardımcı programlar dışındaki Databricks Yardımcı Programları işlevselliği aracılığıyla
dbutils
kullanılamaz.
Bahşiş
Ayrıca python için databricks SDK'sını kullanarak yalnızca önceki Databricks Yardımcı Programları API'lerine değil kullanılabilir databricks REST API'lerine de erişebilirsiniz. Bkz. PyPI üzerinde databricks-sdk .
uygulamasını başlatmak WorkspaceClient
için databricks SDK'sının kimliğini çalışma alanıyla doğrulamak için yeterli bilgi sağlamanız gerekir. Örneğin, aşağıdakileri yapabilirsiniz:
Çalışma alanı URL'sini ve erişim belirtecinizi doğrudan kodunuzun içinde sabit kodlayın ve ardından aşağıdaki gibi başlatın
WorkspaceClient
. Bu seçenek desteklense de Databricks , kodunuzun sürüm denetimine iade edilmesi veya başka bir şekilde paylaşılması durumunda erişim belirteçleri gibi hassas bilgileri kullanıma sunmasından bu seçeneği önermez :from databricks.sdk import WorkspaceClient w = WorkspaceClient(host = f"https://{retrieve_workspace_instance_name()}", token = retrieve_token())
ve alanlarını içeren bir yapılandırma profili oluşturun veya belirtin ve ardından aşağıdaki gibi başlatın
WorkspaceClient
:host
token
from databricks.sdk import WorkspaceClient w = WorkspaceClient(profile = "<profile-name>")
Ortam değişkenlerini databricks
DATABRICKS_HOST
DATABRICKS_TOKEN
Bağlan için ayarladığınız gibi ayarlayın ve aşağıdaki gibi başlatınWorkspaceClient
:from databricks.sdk import WorkspaceClient w = WorkspaceClient()
Python için Databricks SDK'sı SPARK_REMOTE
Databricks Bağlan ortam değişkenini tanımıyor.
Python için Databricks SDK'sı için ek Azure Databricks kimlik doğrulama seçeneklerinin yanı sıra kullanılabilir Databricks REST API'lerine çalışma alanı düzeyinde değil hesap düzeyinde erişmek üzere Databricks SDK'ları içinde başlatma AccountClient
için bkz . PyPI üzerinde databricks-sdk .
Aşağıdaki örnekte, Databricks Yardımcı Programlarını otomatikleştirmek için Python için Databricks SDK'sının nasıl kullanılacağı gösterilmektedir. Bu örnek, çalışma alanı içinde Unity Kataloğu biriminin yolunda adlı zzz_hello.txt
bir dosya oluşturur, dosyadaki verileri okur ve ardından dosyayı siler. Bu örnekte, ortam değişkenlerinin DATABRICKS_HOST
ve DATABRICKS_TOKEN
önceden ayarlanmış olduğu varsayılır:
from databricks.sdk import WorkspaceClient
w = WorkspaceClient()
file_path = "/Volumes/main/default/my-volume/zzz_hello.txt"
file_data = "Hello, Databricks!"
fs = w.dbutils.fs
fs.put(
file = file_path,
contents = file_data,
overwrite = True
)
print(fs.head(file_path))
fs.rm(file_path)
Ayrıca Bkz. Python için Databricks SDK belgelerinde dbutils ile etkileşim.