Aracılığıyla paylaş


Visual Studio Code'u Python için Databricks Connect ile kullanma

Not

Bu makale Databricks Runtime 13.3 LTS ve üzeri için Databricks Connect'i kapsar.

Bu makalede, Visual Studio Code ile Python için Databricks Connect'in nasıl kullanılacağı açıklanır. Databricks Connect popüler IDE'leri, not defteri sunucularını ve diğer özel uygulamaları Azure Databricks kümelerine bağlamanızı sağlar. Bkz. Databricks Connect nedir?. Bu makalenin Scala sürümü için bkz . Scala için Databricks Connect ile Visual Studio Code kullanma.

Not

Databricks Connect'i kullanmaya başlamadan önce Databricks Connect istemcisini ayarlamanız gerekir.

İpucu

Visual Studio Code için Databricks uzantısı, Databricks Runtime 13.3 LTS ve üzeri için Databricks Connect için yerleşik desteğe zaten sahiptir. Bkz . Visual Studio Code için Databricks uzantısı için Databricks Connect kullanarak kodda hata ayıklama.

Databricks Connect'i Visual Studio Code ve Python ile kullanmak için bu yönergeleri izleyin.

  1. Visual Studio Code’u başlatın.

  2. Python sanal ortamınızı içeren klasörü açın (Dosya > Aç Klasörü).

  3. Visual Studio Code Terminali'nde (Terminali Görüntüle>), sanal ortamı etkinleştirin.

  4. Geçerli Python yorumlayıcısını sanal ortamdan başvuruda bulunabilecek şekilde ayarlayın:

    1. Komut Paleti'nde (Komut Paletini Görüntüle>) yazın Python: Select Interpreterve Enter tuşuna basın.
    2. Sanal ortamdan başvuruda bulunan Python yorumlayıcı yolunu seçin.
  5. Klasöre örnek kodu veya kendi kodunuzu içeren bir Python kodu (.py) dosyası ekleyin. Kendi kodunuzu kullanıyorsanız, en azından örnek kodda gösterildiği gibi başlatmanız DatabricksSession gerekir.

  6. Kodu çalıştırmak için ana menüden Hata Ayıklama olmadan Çalıştır'a > tıklayın. Tüm Python kodu yerel olarak çalıştırılırken, DataFrame işlemlerini içeren tüm PySpark kodu uzak Azure Databricks çalışma alanında küme üzerinde çalışır ve çalıştırma yanıtları yerel arayana geri gönderilir.

  7. Kodda hata ayıklamak için:

    1. Python kod dosyası açıkken, çalışırken kodunuzun duraklatılmasını istediğiniz kesme noktalarını ayarlayın.
    2. Kenar çubuğunda Çalıştır ve Hata Ayıkla simgesine tıklayın veya ana menüde Çalıştırmayı Görüntüle'ye > tıklayın.
    3. Çalıştır ve Hata Ayıkla görünümünde Çalıştır ve Hata Ayıkla düğmesine tıklayın.
    4. Kodu çalıştırmaya ve hata ayıklamaya başlamak için ekrandaki yönergeleri izleyin.

    Tüm Python kodu yerel olarak hata ayıklanırken, tüm PySpark kodu uzak Azure Databricks çalışma alanında kümede çalışmaya devam eder. Çekirdek Spark altyapısı kodu doğrudan istemciden hata ayıklanamaz.

Daha ayrıntılı çalıştırma ve hata ayıklama yönergeleri için bkz. VS Code'da hata ayıklayıcıyı ve Python hata ayıklamasını yapılandırma ve çalıştırma.