Aracılığıyla paylaş


Python için Databricks Connect ile klasik Jupyter Notebook kullanma

Not

Bu makale Databricks Runtime 13.3 LTS ve üzeri için Databricks Connect'i kapsar.

Bu makalede klasik Jupyter Notebook ile Python için Databricks Connect'in nasıl kullanılacağı anlatılmıştır. Databricks Connect popüler not defteri sunucularını, IDE'leri ve diğer özel uygulamaları Azure Databricks kümelerine bağlamanızı sağlar. Bkz. Databricks Connect nedir?.

Not

Databricks Connect'i kullanmaya başlamadan önce Databricks Connect istemcisini ayarlamanız gerekir.

Databricks Connect'i klasik Jupyter Notebook ve Python ile kullanmak için bu yönergeleri izleyin.

  1. Klasik Jupyter Notebook'u yüklemek için Python sanal ortamınız etkinleştirildiğinde terminalinizde veya Komut İsteminizde aşağıdaki komutu çalıştırın:

    pip3 install notebook
    
  2. Klasik Jupyter Notebook'u web tarayıcınızda başlatmak için etkinleştirilmiş Python sanal ortamınızdan aşağıdaki komutu çalıştırın:

    jupyter notebook
    

    Klasik Jupyter Notebook web tarayıcınızda görünmüyorsa, sanal ortamınızla veya 127.0.0.1 sanal ortamınızdan başlayan localhost URL'yi kopyalayın ve web tarayıcınızın adres çubuğuna girin.

  3. Yeni not defteri oluşturma: Klasik Jupyter Notebook'ta, Dosyalar sekmesinde Yeni > Python 3 (ipykernel) seçeneğine tıklayın.

  4. Not defterinin ilk hücresine örnek kodu veya kendi kodunuzu girin. Kendi kodunuzu kullanıyorsanız, en azından örnek kodda gösterildiği gibi başlatmanız DatabricksSession gerekir.

  5. Not defterini çalıştırmak için Hücre > Tümünü Çalıştır'a tıklayın. Tüm Python kodu yerel olarak çalıştırılırken, DataFrame işlemlerini içeren tüm PySpark kodu uzak Azure Databricks çalışma alanında küme üzerinde çalışır ve çalıştırma yanıtları yerel arayana geri gönderilir.

  6. Not defterinde hata ayıklamak için not defterinizin başına aşağıdaki kod satırını ekleyin:

    from IPython.core.debugger import set_trace

    Ardından, not defteri yürütmesinin bu noktasında hata ayıklama deyimlerini girmek için öğesini çağırın set_trace() . Tüm Python kodu yerel olarak hata ayıklanırken, tüm PySpark kodu uzak Azure Databricks çalışma alanında kümede çalışmaya devam eder. Çekirdek Spark altyapısı kodu doğrudan istemciden hata ayıklanamaz.

  7. Klasik Jupyter Not Defteri'ni kapatmak için Dosya > Kapat ve Durdur'a tıklayın. Klasik Jupyter Notebook işlemi terminalinizde veya Komut İsteminizde çalışmaya devam ediyorsa, onaylamak için tuşuna basıp Ctrl + c girerek y bu işlemi durdurun.