Aracılığıyla paylaş


Geliştirici araçları

Databricks, Azure Databricks ile tümleşen ve Databricks kaynaklarını ve verilerini program aracılığıyla yöneten uygulamalar ve çözümler geliştirmenize yardımcı olacak bir araç ekosistemi sağlar.

Bu makalede, yaygın geliştirici senaryolarına yönelik en iyi araçlara yönelik bu araçlara ve önerilere genel bir bakış sağlanır.

Databricks geliştiriciler için hangi araçları sağlar?

Aşağıdaki tabloda Databricks tarafından sağlanan geliştirici araçlarının listesi verilmiştir.

Araç Açıklama
Kimlik doğrulama ve yetkilendirme Azure Databricks ile çalışmak üzere araçlarınız, betikleriniz ve uygulamalarınız için kimlik doğrulaması ve yetkilendirmeyi yapılandırın.
Databricks Connect PyCharm, IntelliJ IDEA, Eclipse, RStudio ve JupyterLab gibi popüler tümleşik geliştirme ortamlarını (IDE) kullanarak Azure Databricks'e bağlanın.

Visual Studio Code kullanıyorsanız, Databricks daha kolay yapılandırmayı etkinleştirmek için ek özellikler sağladığından, Databricks Connect'in üzerinde oluşturulan Visual Studio Code için Databricks uzantısını önerir.
Visual Studio Code için Databricks uzantısı Visual Studio Code tümleşik geliştirme ortamından (IDE) uzak Azure Databricks çalışma alanlarınıza bağlanın.
PyCharm Databricks eklentisi Uzak bir Databricks çalışma alanına bağlantı yapılandırın ve PyCharm'dan Databricks kümelerinde dosya çalıştırın. Bu eklenti, Databricks ile ortak olarak JetBrains tarafından geliştirilmiş ve sağlanmıştır.
Databricks SDK'ları Python, Java, Go ve R gibi popüler diller için yazılmış kod kitaplıklarından Azure Databricks'i otomatikleştirin. CURL/ Postman kullanarak REST API çağrılarını doğrudan göndermek yerine, seçtiğiniz bir programlama dilini kullanarak Databricks ile etkileşime geçmek için SDK kullanabilirsiniz.
SQL sürücüleri ve araçları SQL komutlarını ve betiklerini çalıştırmak, Azure Databricks ile program aracılığıyla etkileşim kurmak ve Azure Databricks SQL işlevselliğini Python, Go, JavaScript ve TypeScript gibi popüler dillerde yazılmış uygulamalarla tümleştirmek için Azure Databricks'e bağlanın.
Databricks CLI Databricks komut satırı arabirimini (CLI) kullanarak Azure Databricks işlevselliğine erişin. CLI, Databricks REST API'sini sarmalar, dolayısıyla REST API çağrılarını doğrudan curl veya Postman kullanarak göndermek yerine Databricks CLI'yi kullanarak Databricks ile etkileşim kurabilirsiniz.
Databricks Varlık Paketleri Databricks Varlık Paketleri'ni (DAB) kullanarak Azure Databricks verileriniz ve yapay zeka projeleriniz için endüstri standardı geliştirme, test ve dağıtım (CI/CD) en iyi yöntemlerini uygulayın.
Databricks Terraform sağlayıcısı ve Databricks için Terraform CDKTF Terraform kullanarak Azure Databricks altyapısını ve kaynaklarını sağlama.
Pulumi Databricks kaynak sağlayıcısı Pulumi kod olarak altyapısını (IaC) kullanarak Azure Databricks altyapısını ve kaynaklarını sağlayın.
CI/CD araçları GitHub Actions, Jenkins ve Apache Airflow gibi popüler CI/CD sistemlerini ve çerçevelerini tümleştirin.

İpucu

Ayrıca Azure Databricks'teki verilere erişmek için kümelere ve SQL ambarlarına birçok popüler üçüncü taraf aracı bağlayabilirsiniz. Bkz. Teknoloji iş ortakları.

Hangi geliştirici aracını kullanmalıyım?

Aşağıdaki tabloda, yaygın geliştirici senaryoları için Databricks aracı önerileri özetlenmiştir.

Senaryolar Öneri
- Yerel IDE'den etkileşimli geliştirme ve hata ayıklama Visual Studio Code için Databricks uzantısı

PyCharm Databricks eklentisi

Diğer IDE'ler için Databricks Connect ile Databricks CLI kullanın
- Komut satırından Databricks ile doğrudan etkileşim
- Kabuk betiği oluşturma
-Deneme
- REST API'yi doğrudan çağırma
- Yerel kimlik doğrulama profillerini yönetme
- Kodu IDE'den Databricks çalışma alanına eşitleme
Databricks CLI
- İş akışlarını yönetme ve projeleri Databricks'e dağıtma
- CI/CD en iyi yöntemlerini uygulama
- Kaynaklarınızı ve varlıklarınızı tek bir birim olarak birlikte sürüm oluşturma, birlikte yazma, birlikte dağıtma
- En yaygın kaynakları destekler
Databricks Varlık Paketleri (CLI'nın bir özelliği)
- Kod olarak altyapı, CI/CD
- Çalışma alanlarını, katalogları, meta veri depolarını yönetme ve oluşturma ve izinleri zorunlu kılma
- Ortam taşınabilirliğini ve olağanüstü durum kurtarmayı garanti edin
- Desteklenen birçok kaynak
Databricks Terraform sağlayıcısı
- Uygulama geliştirme
- Mevcut dağıtım sistemleriyle tümleştirme
- Özel Databricks iş akışları ve yeni web hizmetleri oluşturma
Databricks Python SDK'sı

Databricks Java SDK'sı

Databricks Go SDK

Databricks R SDK
- Yalnızca gelişmiş senaryolar
- Neredeyse tüm Databricks kaynakları kullanılabilir
Databricks REST API