Aracılığıyla paylaş


Yerel geliştirme araçları

Databricks, Azure Databricks ile tümleşen ve Databricks kaynaklarını ve verilerini program aracılığıyla yöneten uygulamalar ve çözümler geliştirmenize yardımcı olacak bir araç ekosistemi sağlar.

Bu makalede, yaygın geliştirici senaryolarına yönelik en iyi araçlara yönelik bu araçlara ve önerilere genel bir bakış sağlanır.

Databricks yerel olarak geliştirme için hangi araçları sağlar?

Aşağıdaki tabloda Databricks tarafından sağlanan geliştirici araçlarının listesi verilmiştir.

Araç Açıklama
Kimlik doğrulama ve yetkilendirme Azure Databricks ile çalışmak üzere araçlarınız, betikleriniz ve uygulamalarınız için kimlik doğrulaması ve yetkilendirmeyi yapılandırın.
Databricks Connect PyCharm, IntelliJ IDEA, Eclipse, RStudio ve JupyterLab gibi popüler tümleşik geliştirme ortamlarını (IDE) kullanarak Azure Databricks'e bağlanın.
Visual Studio Code kullanıyorsanız Databricks, daha kolay yapılandırmayı etkinleştirmek için ek özellikler sağladığından, Databricks Connect'in üzerinde oluşturulan Visual Studio Code için Databricks uzantısını önerir.
Visual Studio Code için Databricks uzantısı Visual Studio Code tümleşik geliştirme ortamından (IDE) uzak Azure Databricks çalışma alanlarınıza bağlanın.
PyCharm Databricks eklentisi Uzak bir Databricks çalışma alanına bağlantı yapılandırın ve PyCharm'dan Databricks kümelerinde dosya çalıştırın. Bu eklenti, Databricks ile ortak olarak JetBrains tarafından geliştirilmiş ve sağlanmıştır.
Databricks SDK'ları Python, Java, Go ve R gibi popüler diller için yazılmış kod kitaplıklarından Azure Databricks'i otomatikleştirin. REST API çağrılarını doğrudan curl veya Postman kullanarak göndermek yerine, seçtiğiniz bir programlama dilini kullanarak Databricks ile etkileşime geçmek için BIR SDK kullanın. Databricks SDK'ları rest API'nin tamamını destekler ve birleşik kimlik doğrulaması ve sayfalandırma gibi birçok senaryoyu kapsayacak şekilde kullanımını ve kapsamını genişletmeyi kolaylaştıran diğer özellikleri sağlar.
SQL sürücüleri ve araçları SQL komutlarını ve betiklerini çalıştırmak, Azure Databricks ile program aracılığıyla etkileşim kurmak ve Azure Databricks SQL işlevselliğini Python, Go, JavaScript ve TypeScript gibi popüler dillerde yazılmış uygulamalarla tümleştirmek için Azure Databricks'e bağlanın.
Databricks CLI Databricks komut satırı arabirimini (CLI) kullanarak Azure Databricks işlevselliğine erişin. CLI, Databricks REST API'sini sarmalar, dolayısıyla REST API çağrılarını doğrudan curl veya Postman kullanarak göndermek yerine Databricks CLI'sini kullanarak Databricks ile etkileşime geçin.
Databricks Varlık Paketleri Databricks Varlık Paketleri'ni kullanarak Azure Databricks verileriniz ve yapay zeka projeleriniz için endüstri standardı geliştirme, test ve dağıtım (CI/CD) en iyi yöntemlerini uygulayın.
Databricks Terraform sağlayıcısı ve Databricks için Terraform Bulut Geliştirme Kiti (CDKTF) Terraform kullanarak Azure Databricks altyapısını ve kaynaklarını sağlama.
CI/CD araçları GitHub Actions, Jenkins ve Apache Airflow gibi popüler CI/CD sistemlerini ve çerçevelerini tümleştirin.

İpucu

Ayrıca Azure Databricks'teki verilere erişmek için kümelere ve SQL ambarlarına birçok popüler üçüncü taraf aracı bağlayabilirsiniz. Daha fazla bilgi için bkz . Teknoloji iş ortakları.

Hangi geliştirici aracını kullanmalıyım?

Aşağıdaki tabloda, yaygın geliştirici senaryoları için Databricks aracı önerileri özetlenmiştir.

Araç Kullanım önerisi
Visual Studio Code için Databricks uzantısı
PyCharm Databricks eklentisi
Diğer IDE'ler için Databricks Connect ile Databricks CLI kullanın
  • Yerel IDE'den etkileşimli geliştirme ve hata ayıklama
Databricks CLI
  • Komut satırından Databricks ile doğrudan etkileşim
  • Kabuk betikleme
  • Deney Yapma
  • REST API'yi doğrudan çağırma
  • Yerel kimlik doğrulama profillerini yönetme
  • IDE'deki kodu Databricks çalışma alanına eşitleme
Databricks Varlık Paketleri (CLI'nın bir özelliği)
  • İş akışlarını yönetme ve projeleri Databricks'e dağıtma
  • CI/CD en iyi yöntemlerini uygulama
  • Kaynaklarınızı ve varlıklarınızı bir arada sürüm oluşturma, ortak yazma, ortak dağıtma gibi tek bir birim olarak yönetin.
  • En yaygın kaynakları destekler
Databricks Terraform sağlayıcısı
  • Kod Olarak Altyapı, CI/CD
  • Çalışma alanlarını, katalogları, meta veri depolarını yönetme ve oluşturma ve izinleri zorunlu kılma
  • Ortam taşınabilirliği ve olağanüstü durum kurtarma garantisi verin
  • Desteklenen birçok kaynak
Databricks Python SDK'sı
Databricks Java SDK'sı
Databricks Go SDK
Databricks R SDK
  • Uygulama geliştirme
  • Mevcut dağıtım sistemleriyle tümleştirme
  • Özel Databricks iş akışları ve yeni web hizmetleri oluşturma
SQL sürücüleri
  • İstemci uygulamalarından SQL komutlarını ve betiklerini çalıştırma
Databricks REST API
  • Tercih ettiğiniz programlama dilinde bir SDK'nın kullanılamadığı işlemleri otomatikleştirme
  • Yalnızca gelişmiş senaryolar
  • Neredeyse tüm Databricks kaynakları kullanılabilir