Aracılığıyla paylaş


Python için Databricks Connect sorunlarını giderme

Not

Bu makale Databricks Runtime 13.3 LTS ve üzeri için Databricks Connect'i kapsar.

Bu makalede Python için Databricks Connect ile ilgili sorun giderme bilgileri sağlanır. Databricks Connect popüler IDE'leri, not defteri sunucularını ve özel uygulamaları Azure Databricks kümelerine bağlamanızı sağlar. Bkz. Databricks Connect nedir?. Bu makalenin Scala sürümü için bkz . Scala için Databricks Connect Sorunlarını Giderme.

Hata: StatusCode.UNAVAILABLE, StatusCode.UNKNOWN, DNS çözümlemesi başarısız oldu veya 500 durumuyla Http2 üst bilgisi alındı

Sorun: Databricks Connect ile kod çalıştırmayı denediğinizde, , StatusCode.UNKNOWN, DNS resolution failedveya Received http2 header with status: 500gibi StatusCode.UNAVAILABLEdizeler içeren bir hata iletisi alırsınız.

Olası neden: Databricks Connect kümenize erişemiyor.

Önerilen çözümler:

  • Çalışma alanı örneği adınızın doğru olduğundan emin olun. Ortam değişkenlerini kullanıyorsanız, ilgili ortam değişkeninin yerel geliştirme makinenizde kullanılabilir ve doğru olduğundan emin olun.
  • Küme kimliğinizin doğru olduğundan emin olun. Ortam değişkenlerini kullanıyorsanız, ilgili ortam değişkeninin yerel geliştirme makinenizde kullanılabilir ve doğru olduğundan emin olun.
  • Kümenizin Databricks Connect ile uyumlu doğru özel küme sürümüne sahip olduğundan emin olun.

Python sürümü uyuşmazlığı

Yerel olarak kullandığınız Python sürümünün kümedeki sürümle en az aynı ikincil sürüme sahip olup olmadığını denetleyin (örneğin, 3.10.11 yerine 3.10.10 Tamam, 3.10 değil 3.9 ).

Yerel olarak yüklenmiş birden çok Python sürümünüz varsa, ortam değişkenini (örneğin, PYSPARK_PYTHON=python3) ayarlayarak Databricks Connect'in doğru sürümü kullandığından PYSPARK_PYTHON emin olun.

Çakışan PySpark yüklemeleri

Paket databricks-connect PySpark ile çakıyor. Her ikisinin de yüklü olması, Python'da Spark bağlamını başlatırken hatalara neden olur. Bu, "akış bozuk" veya "sınıf bulunamadı" hataları da dahil olmak üzere çeşitli yollarla bildirimde bulunabilir. Python ortamınızda PySpark yüklüyse databricks-connect'i yüklemeden önce kaldırıldığından emin olun. PySpark'ı kaldırdıktan sonra Databricks Connect paketini tamamen yeniden yüklediğinizden emin olun:

pip3 uninstall pyspark
pip3 uninstall databricks-connect
pip3 install --upgrade "databricks-connect==14.0.*"  # or X.Y.* to match your specific cluster version.

İkili dosyalar için çakışan veya Eksik PATH girdi

PATH'niz, gibi spark-shell komutların Databricks Connect ile sağlanan ikili dosya yerine önceden yüklenmiş başka bir ikili dosya çalıştıracak şekilde yapılandırılmış olması mümkündür. Databricks Connect ikili dosyalarının öncelikli olduğundan emin olmanız veya önceden yüklenmiş olanları kaldırmanız gerekir.

gibi spark-shellkomutları çalıştıramıyorsanız, PATH'iniz tarafından pip3 install otomatik olarak ayarlanmamış olabilir ve yükleme bin dizinini PATH'inize el ile eklemeniz gerekir. Bu ayar olmasa bile Databricks Connect'i IDE'lerle kullanmak mümkündür.

Windows'ta dosya adı, dizin adı veya birim etiketi söz dizimi yanlış

Windows üzerinde Databricks Connect kullanıyorsanız ve bkz:

The filename, directory name, or volume label syntax is incorrect.

Databricks Connect, yolunuzda bir alan olan bir dizine yüklendi. Boşluksuz bir dizin yoluna yükleyerek veya kısa ad formunu kullanarak yolunuzu yapılandırarak bu sorunu geçici olarak giderebilirsiniz.