Çalışma alanı nesnelerine giriş
Bu makale, Azure Databricks çalışma alanı nesnelerine üst düzey bir giriş sağlar. Çalışma alanı tarayıcısında çalışma alanı nesnelerini kişilikler arasında oluşturabilir, görüntüleyebilir ve düzenleyebilirsiniz.
namimg çalışma alanı varlıklarıyla ilgili not
Çalışma alanı varlığının tam adı, temel adından ve dosya uzantısından oluşur. Örneğin, not defterinin dosya uzantısı, not defterinin diline ve .ipynb
biçimine bağlı olarak , .scala
.sql
, , .r
ve olabilir.py
.
Bir not defteri varlığı oluşturduğunuzda, temel adı ve tam adı (dosya uzantısıyla birleştirilmiş temel ad) herhangi bir çalışma alanı klasörü içinde benzersiz olmalıdır. Bir varlığı adlandırdığınızda Databricks, dosya uzantısını ekleyerek bu ölçüte uyup uymadığını denetler ve tam ad klasördeki mevcut bir dosyayla eşleşiyorsa, ada izin verilmez ve not defteri için yeni bir ad seçmeniz gerekir. Örneğin, adlı test.py
bir Python dosyasıyla aynı klasörde adlı test
bir Python not defteri (Python kaynak biçiminde) oluşturmaya çalışırsanız buna izin verilmez.
Küme
Azure Databricks Veri Bilimi ve Mühendislik ve Databricks Mozaik yapay zeka kümeleri, üretim ETL işlem hatlarını çalıştırma, akış analizi, geçici analiz ve makine öğrenmesi gibi çeşitli kullanım örnekleri için birleşik bir platform sağlar. Küme, Azure Databricks işlem kaynağı türüdür. Diğer işlem kaynağı türleri arasında Azure Databricks SQL ambarları bulunur.
Kümeleri yönetme ve kullanma hakkında ayrıntılı bilgi için bkz . İşlem.
Dizüstü
Not defteri, dosya ve tablolar, görselleştirmeler ve anlatı metni üzerinde çalışan bir dizi çalıştırılabilir hücre (komut) içeren belgeler için web tabanlı bir arabirimdir. Komutlar sıralı olarak çalıştırılabilir ve daha önce çalıştırılacak bir veya daha fazla komutun çıkışına başvurulabilir.
Not defterleri, Azure Databricks'te kod çalıştırmaya yönelik bir mekanizmadır. Diğer mekanizma ise işlerdir.
Not defterlerini yönetme ve kullanma hakkında ayrıntılı bilgi için bkz . Databricks not defterlerine giriş.
Işleri
İşler, Azure Databricks'te kod çalıştırmaya yönelik bir mekanizmadır. Diğer mekanizma not defterleridir.
İşleri yönetme ve kullanma hakkında ayrıntılı bilgi için bkz . İş akışlarını zamanlama ve düzenleme.
Kitaplık
Kitaplık, üçüncü taraf veya yerel olarak oluşturulmuş kodu kümelerinizde çalışan not defterleri ve işler için kullanılabilir hale getirir.
Kitaplıkları yönetme ve kullanma hakkında ayrıntılı bilgi için bkz . Kitaplıklar.
Veri
Azure Databricks çalışma alanına bağlı dağıtılmış bir dosya sistemine veri aktarabilir ve Azure Databricks not defterlerinde ve kümelerinde bu verilerle çalışabilirsiniz. Verilere erişmek için çok çeşitli Apache Spark veri kaynakları da kullanabilirsiniz.
Verileri yükleme hakkında ayrıntılı bilgi için bkz . Databricks lakehouse'a veri alma.
Dosyaları
Önemli
Bu özellik Genel Önizlemededir.
Databricks Runtime 11.3 LTS ve üzerinde, Databricks çalışma alanında rastgele dosyalar oluşturabilir ve kullanabilirsiniz. Dosyalar herhangi bir dosya türünde olabilir. Bazı yaygın örnekler aşağıdakileri içermektedir:
.py
özel modüllerde kullanılan dosyalar..md
README.md
gibi dosyalar..csv
veya diğer küçük veri dosyaları..txt
Dosyaları.- Günlük dosyaları.
Dosyaları kullanma hakkında ayrıntılı bilgi için bkz . Azure Databricks'te dosyalarla çalışma. Databricks not defterleriyle geliştirirken kodunuzu modüler hale getirmek için dosyaları kullanma hakkında bilgi için bkz . Databricks not defterleri arasında kod paylaşma
Git klasörleri
Git klasörleri, içerikleri bir uzak Git deposuyla eşitlenerek birlikte sürümlenen Azure Databricks klasörleridir. Databricks Git klasörlerini kullanarak Azure Databricks'te not defterleri geliştirebilir ve işbirliği ve sürüm denetimi için uzak git deposunu kullanabilirsiniz.
Depoları kullanma hakkında ayrıntılı bilgi için bkz . Databricks Git klasörleri için Git tümleştirmesi.
Model
Model , MLflow Model Kayıt Defteri'nde kayıtlı bir modeli ifade eder. Model Kayıt Defteri, MLflow modellerinin tüm yaşam döngüsünü yönetmenizi sağlayan merkezi bir model deposudur. Kronolojik model kökeni, model sürümü oluşturma, aşama geçişleri ve model ve model sürümü ek açıklamaları ve açıklamaları sağlar.
Modelleri yönetme ve kullanma hakkında ayrıntılı bilgi için bkz . Unity Kataloğu'nda model yaşam döngüsünü yönetme.
Deney
MLflow denemesi, MLflow makine öğrenmesi modeli eğitim çalıştırmaları için birincil kuruluş birimi ve erişim denetimidir; tüm MLflow çalıştırmaları bir denemeye aittir. Her deneme, çalıştırmaları görselleştirmenize, aramanıza ve karşılaştırmanıza ve diğer araçlarda analiz için çalıştırma yapıtlarını veya meta verileri indirmenize olanak tanır.
Denemeleri yönetme ve kullanma hakkında ayrıntılı bilgi için bkz . MLflow denemeleriyle eğitim çalıştırmalarını düzenleme.
Sorgular
Sorgular, verilerinizle etkileşim kurmanızı sağlayan SQL deyimleridir. Daha fazla bilgi için bkz . Kaydedilen sorgulara erişme ve bu sorguları yönetme.
Panolar
Panolar, sorgu görselleştirmelerinin ve açıklamaların sunularıdır. Bkz. Panolar veya Eski panolar.
Uyarılar
Uyarılar, sorgu tarafından döndürülen bir alanın eşiğe ulaştığına ilişkin bildirimlerdir. Daha fazla bilgi için bkz . Databricks SQL uyarıları nedir?.
Çalışma alanı nesnelerine başvurular
Geçmişte, kullanıcıların bazı Databricks API'leri (%sh
) için yol ön ekini eklemesi /Workspace
gerekiyordu ancak diğerleri için (%run
REST API girişleri) dahil değildi.
Kullanıcılar her yerde ön ekiyle /Workspace
çalışma alanı yollarını kullanabilir. Ön ek olmadan yollara yapılan /Workspace
eski başvurular yeniden yönlendirilir ve çalışmaya devam eder. Tüm çalışma alanı yollarının Birim ve DBFS yollarından ayırt etmek için ön eki taşımasını /Workspace
öneririz.
Tutarlı /Workspace
yol ön eki davranışı için önkoşul şudur: Çalışma alanı kök düzeyinde bir /Workspace
klasör olamaz. Kök düzeyinde bir /Workspace
klasörünüz varsa ve bu UX iyileştirmesini etkinleştirmek istiyorsanız, oluşturduğunuz klasörü silin veya yeniden adlandırın /Workspace
ve Azure Databricks hesap ekibinize başvurun.
Dosya, klasör veya not defteri URL'sini paylaşma
Azure Databricks çalışma alanınızda, çalışma alanı dosyalarına, not defterlerine ve klasörlere yönelik URL'ler şu biçimlerdedir:
Çalışma alanı dosyası URL'leri
https://<databricks-instance>/?o=<16-digit-workspace-ID>#files/<16-digit-object-ID>
Not Defteri URL'leri
https://<databricks-instance>/?o=<16-digit-workspace-ID>#notebook/<16-digit-object-ID>/command/<16-digit-command-ID>
Klasör (çalışma alanı ve Git) URL'leri
https://<databricks-instance>/browse/folders/<16-digit-ID>?o=<16-digit-workspace-ID>
Geçerli yoldaki herhangi bir klasör, dosya veya not defteri Git çekme komutuyla güncelleştirilirse veya aynı adla silinip yeniden oluşturulursa bu bağlantılar kesilebilir. Ancak, uygun erişim düzeylerine sahip diğer Databricks kullanıcılarıyla paylaşmak için çalışma alanı yolunu temel alan bir bağlantı oluşturmak için bağlantıyı şu biçimdeki bir bağlantıya değiştirebilirsiniz:
https://<databricks-instance>/?o=<16-digit-workspace-ID>#workspace/<full-workspace-path-to-file-or-folder>
Klasörlere, not defterlerine ve dosyalara bağlantılar, url'deki her şey çalışma ?o=<16-digit-workspace-ID>
alanı kökündeki dosya, klasör veya not defterinin yoluyla değiştirilerek paylaşılabilir. Bir klasörün URL'sini paylaşıyorsanız, özgün URL'den de kaldırın /browse/folders/<16-digit-ID>
.
Dosya yolunu almak için, çalışma alanınızda paylaşmak istediğiniz klasöre, not defterine veya dosyaya sağ tıklayıp URL/yol Tam yol> kopyala'yı seçerek bağlam menüsünü açın. #workspace
Az önce kopyaladığınız dosya yoluna yapıştırın ve yukarıdaki URL biçimiyle eşleşmesi için öğesinin ?o=<16-digit-workspace-ID>
sonuna sonuç dizesini ekleyin.
URL formülasyonu örneği #1: Klasör URL'leri
Çalışma alanı klasörü URL'sini https://<databricks-instance>/browse/folders/1111111111111111?o=2222222222222222
paylaşmak için alt dizeyi browse/folders/1111111111111111
URL'den kaldırın. Paylaşmak istediğiniz klasör veya çalışma alanı nesnesinin yolunu ekleyin #workspace
.
Bu durumda, çalışma alanı yolu bir klasörüne ( /Workspace/Users/user@example.com/team-git/notebooks
. Çalışma alanınızdan tam yolu kopyaladıktan sonra artık paylaşılabilir bağlantıyı oluşturabilirsiniz:
https://<databricks-instance>/?o=2222222222222222#workspace/Workspace/Users/user@example.com/team-git/notebooks
URL formülasyonu örneği 2: Not Defteri URL'leri
Not defteri URL'sini https://<databricks-instance>/?o=1111111111111111#notebook/2222222222222222/command/3333333333333333
paylaşmak için öğesini kaldırın #notebook/2222222222222222/command/3333333333333333
. Klasör veya çalışma alanı nesnesinin yolunu ekleyin #workspace
.
Bu durumda, çalışma alanı yolu bir not defterine /Workspace/Users/user@example.com/team-git/notebooks/v1.0/test-notebook
işaret edilir. Çalışma alanınızdan tam yolu kopyaladıktan sonra artık paylaşılabilir bağlantıyı oluşturabilirsiniz:
https://<databricks-instance>/?o=1111111111111111#workspace/Workspace/Users/user@example.com/team-git/notebooks/v1.0/test-notebook
Artık paylaşabileceğiniz dosya, klasör veya not defteri yolu için kararlı bir URL'niz var! URL'ler ve tanımlayıcılar hakkında daha fazla bilgi için bkz . Çalışma alanı nesneleri için tanımlayıcıları alma.