Python için Databricks Connect'i yükleme

Not

Bu makale Databricks Runtime 13.3 LTS ve üzeri için Databricks Connect'i kapsar.

Bu makalede, Python için Databricks Connect'in nasıl yükleneceği açıklanır. Bkz. Databricks Connect.

Gereksinimler

Databricks Connect'i yüklemeden önce çalışma alanınızın ve yerel ortamınızın gereksinimleri karşıladığından emin olun. Bkz. Databricks Connect kullanım gereksinimleri.

Python sanal ortamını etkinleştirme

Databricks, Databricks Connect ile kullandığınız her Python sürümü için bir Python virtual ortamınız etkinleştirilmesini kesinlikle önerir. Python sanal ortamlar, Python ve Databricks Connect'in doğru sürümlerini birlikte kullandığınızdan emin olmanıza yardımcı olur. Bu araçlar ve bunları etkinleştirme hakkında daha fazla bilgi için bkz . venv veya Şiir.

Databricks Connect istemcisini yükleme

Bu bölümde Venv veya Poetry ile Databricks Connect istemcisinin nasıl yükleneceği açıklanmaktadır.

Not

Visual Studio Code için Databricks uzantısı zaten yüklüyse, uzantıyı kullanarak Databricks Runtime 13.3 LTS ve üzeri için Databricks Connect'i yükleyebilirsiniz. Visual Studio Code için Databricks eklentisi için Databricks Connect kullanarak hata ayıklama kodunu kontrol edin.

Venv ile Databricks Connect istemcisini yükleme

  1. Sanal ortamınız etkinleştirildiğinde, eğer PySpark zaten yüklüyse, uninstall komutunu çalıştırarak kaldırın. Paketin PySpark ile çakışması databricks-connect nedeniyle bu gereklidir. Ayrıntılar için bkz . Çakışan PySpark yüklemeleri. PySpark'ın zaten yüklü olup olmadığını denetlemek için komutunu çalıştırın show .

    # Is PySpark already installed?
    pip3 show pyspark
    
    # Uninstall PySpark
    pip3 uninstall pyspark
    
  2. Sanal ortamınız hala etkinken install komutunu çalıştırarak Databricks Connect istemcisini yükleyin. --upgrade Mevcut istemci yüklemelerini belirtilen sürüme yükseltmek için seçeneğini kullanın.

    pip3 install --upgrade "databricks-connect==17.3.*"  # Or X.Y.* to match your cluster version.
    

    Not

    Databricks, en son paketin yüklendiğinden emin olmak için databricks-connect==X.Y.* yerine databricks-connect=X.Y belirtmek üzere "nokta-yıldız" gösterimini eklemenizi önerir. Bu bir gereksinim olmasa da, bu küme için desteklenen en son özellikleri kullanabilmenize yardımcı olur.

Şiir ile Databricks Connect istemcisini yükleme

  1. Sanal ortamınız etkinleştirildiğinde, eğer PySpark zaten yüklüyse, remove komutunu çalıştırarak kaldırın. Paketin PySpark ile çakışması databricks-connect nedeniyle bu gereklidir. Ayrıntılar için bkz . Çakışan PySpark yüklemeleri. PySpark'ın zaten yüklü olup olmadığını denetlemek için komutunu çalıştırın show .

    # Is PySpark already installed?
    poetry show pyspark
    
    # Uninstall PySpark
    poetry remove pyspark
    
  2. Sanal ortamınız hala etkinken add komutunu çalıştırarak Databricks Connect istemcisini yükleyin.

    poetry add databricks-connect@~17.3  # Or X.Y to match your cluster version.
    

    Not

    Databricks, en son paketin yüklendiğinden emin olmak için databricks-connect@~17.3 yerine databricks-connect==17.3 belirtmek amacıyla "at-tilde" gösterimini kullanmanızı önerir. Bu bir gereksinim olmasa da, bu küme için desteklenen en son özellikleri kullanabilmenize yardımcı olur.