Aracılığıyla paylaş


Python için Databricks Connect'i yükleme

Not

Bu makale Databricks Runtime 13.3 LTS ve üzeri için Databricks Connect'i kapsar.

Bu makalede Python için Databricks Connect'in nasıl yükleneceği açıklanmaktadır. Bkz. Databricks Connect nedir?.

Gereksinimler

Databricks Connect'i yüklemeden önce çalışma alanınızın ve yerel ortamınızın gereksinimleri karşıladığından emin olun. Bkz. Databricks Connect kullanım gereksinimleri.

Python sanal ortamını etkinleştirme

Databricks, Databricks Connect ile kullandığınız her Python sürümü için etkinleştirilmiş bir Python sanal ortamına sahip olduğunuzu kesinlikle önerir. Python sanal ortamları, Python ve Databricks Connect'in doğru sürümlerini birlikte kullandığınızdan emin olmanıza yardımcı olur. Bu araçlar ve bunları etkinleştirme hakkında daha fazla bilgi için bkz . venv veya Şiir.

Databricks Connect istemcisini yükleme

Bu bölümde Venv veya Poetry ile Databricks Connect istemcisinin nasıl yükleneceği açıklanmaktadır.

Not

Visual Studio Code için Databricks uzantısı zaten yüklüyse, uzantıyı kullanarak Databricks Runtime 13.3 LTS ve üzeri için Databricks Connect'i yükleyebilirsiniz. Bkz . Visual Studio Code için Databricks uzantısı için Databricks Connect kullanarak kodda hata ayıklama.

Venv ile Databricks Connect istemcisini yükleme

  1. Sanal ortamınız etkinleştirildiğinde, pyspark zaten yüklüyse komutunu çalıştırarak uninstall kaldırın. Paketin PySpark ile çakışması databricks-connect nedeniyle bu gereklidir. Ayrıntılar için bkz . Çakışan PySpark yüklemeleri. PySpark'ın zaten yüklü olup olmadığını denetlemek için komutunu çalıştırın show .

    # Is PySpark already installed?
    pip3 show pyspark
    
    # Uninstall PySpark
    pip3 uninstall pyspark
    
  2. Sanal ortamınız hala etkinken komutunu çalıştırarak Databricks Connect istemcisini install yükleyin. --upgrade Mevcut istemci yüklemelerini belirtilen sürüme yükseltmek için seçeneğini kullanın.

    pip3 install --upgrade "databricks-connect==17.3.*"  # Or X.Y.* to match your cluster version.
    

    Not

    Databricks, en son paketin yüklendiğinden emin olmak için yerine databricks-connect==X.Y.*belirtmek databricks-connect=X.Y üzere "nokta-yıldız işareti" gösterimini eklemenizi önerir. Bu bir gereksinim olmasa da, bu küme için desteklenen en son özellikleri kullanabilmenize yardımcı olur.

Şiir ile Databricks Connect istemcisini yükleme

  1. Sanal ortamınız etkinleştirildiğinde, pyspark zaten yüklüyse komutunu çalıştırarak remove kaldırın. Paketin PySpark ile çakışması databricks-connect nedeniyle bu gereklidir. Ayrıntılar için bkz . Çakışan PySpark yüklemeleri. PySpark'ın zaten yüklü olup olmadığını denetlemek için komutunu çalıştırın show .

    # Is PySpark already installed?
    poetry show pyspark
    
    # Uninstall PySpark
    poetry remove pyspark
    
  2. Sanal ortamınız hala etkinken komutunu çalıştırarak Databricks Connect istemcisini add yükleyin.

    poetry add databricks-connect@~17.3  # Or X.Y to match your cluster version.
    

    Not

    Databricks, en son paketin yüklendiğinden emin olmak için yerine databricks-connect@~17.3belirtmek databricks-connect==17.3 üzere "at-tilde" gösterimini kullanmanızı önerir. Bu bir gereksinim olmasa da, bu küme için desteklenen en son özellikleri kullanabilmenize yardımcı olur.