Databricks Depolarına ne oldu?
Azure Databricks, kullanıcıların Çalışma Alanı kullanıcı arabiriminden Git tarafından yedeklenen klasörlerle doğrudan çalışmasını sağlayan yeni kullanıcı arabirimi öğelerini kullanıma sunar ve önceki ayrı "Depolar" özelliği işlevselliğini etkili bir şekilde değiştirir.
Bu değişiklik benim için ne anlama geliyor?
Proje varlıklarının birlikte sürümlenmiş Git tabanlı kaynak denetimi için Databricks Repos özelliğinin kullanıcısıysanız, temel işlevsellik değişmemiştir. En önemli fark, birçok bağlamsal kullanıcı arabirimi işleminin artık "Depolar" yerine "Git klasörlerine" başvurmasıdır.
Örneğin, Git deposu tarafından desteklenen bir Databricks klasörü, kullanıcı arabiriminden Yeni ve ardından Depo seçilerek oluşturulabilir:
Şimdi Yeni'yi ve Git klasörü'ne tıklayın. Aynı şey, farklı bir isim!
Bu değişiklik, sürüm denetimli klasörlerle çalışmayı basitleştiren bazı iyileştirmeler sağlar:
- Daha iyi klasör düzenlemesi: Git klasörleri, çalışma alanı dosya ağacının herhangi bir düzeyinde oluşturulabilir ve Git klasörlerinizi projeniz için en uygun şekilde düzenlemenizi sağlar. Örneğin, adresinde
/Workspace/Users/<user email>/level_1/level_2/level_3/<Git folder name>
Git klasörleri oluşturabilirsiniz. Depolar yalnızca gibi/Workspace/Repos/<user email>/<Repo name>
Repos kullanıcı klasörünün kökü gibi sabit bir dizin düzeyinde oluşturulabilir.- Not: Git klasörleri, Depolar tarafından bugün desteklenmeyen diğer varlıkları içerebilir veya bu varlıklarla birlikte yerleştirebilir. DBSQL varlıkları ve MLflow denemeleri gibi desteklenmeyen varlık türleri Git klasörlerine taşınabilir. Zaman içinde ek varlıklar için serileştirme desteği eklenecektir.
- Basitleştirilmiş kullanıcı arabirimi davranışları: Bu değişiklik Git ile çalışan ortak bir çalışma alanı etkileşimini doğrudan Databricks çalışma alanınıza getirir ve çalışma alanınızla sürüm denetimindeki Git klasörleriniz arasında gezinmek için harcanan süreyi azaltır.
Özellikle ne değişti?
- Git klasörleri dizinin dışında
/Repos
oluşturulabilir. - Git klasörleri, Databricks çalışma alanında Yeni>Git klasörü seçilerek oluşturulur. Bu, altında
/Workspace/Users/<user-email>/
yeni bir Git klasörü oluşturur. - Git klasörleri, altında
/Workspace/Users/<user-email>
oldukları sürece çalışma alanı dosya ağacının çeşitli derinliklerinde oluşturulabilir. Örneğin, adresinde/Workspace/Users/<user-email>/level_1/level_2/level_3/<git-folder-name>
Git klasörleri oluşturabilirsiniz. altında/Workspace/Users/<user-email>
birden çok Git klasörünüz olabilir. - Git klasörlerinde desteklenmeyen varlıklara izin verilir. Zaman içinde diğer varlık türleri için serileştirme desteği eklenecektir.
- Depolardan farklı olarak, Uzak depo URL'si olmadan Databricks'te yeni bir Git klasörü oluşturamazsınız.
Geçerli Depolarıma ne olur?
Azure Databricks çalışma alanınız için Depolar tanımlandıysa, bunlar kaybolmaz ve mevcut Depoları Git klasörlerine geçirmeniz gerekmez. Bunun yerine Repos, Azure Databricks çalışma alanı kullanıcı arabirimiyle tümleştirilmiştir ve artık üst düzey bir Depo düğümü altında düzenlenmiş ayrı bir klasör kümesi olarak sunulmaz. Artık kök klasörün altında /Workspace
olarak /Workspace/Repos
bulunabilirler.
- Mevcut
/Repos
başvurular çalışmaya devam edecektir. ile/Repos
başlayan veya/Workspace/Repos
aynı klasöre başvuran yollar ve içindedbutils.notebook.run
bildirilen yollarjobs
ve%run
başvurular değişmeden kalabilir. - Nadir bir durumda, bu yeniden yönlendirmenin çalışması için çalışma alanınızda tek seferlik bir değişiklik yapmanız gerekir. Bu değişiklik hakkında daha fazla ayrıntı için bkz . Çalışma alanı nesnelerine başvurular.
Databricks, Kullanıcıların Databricks çalışma alanından Git kaynak denetimine bağlanması gerekiyorsa Repos yerine yeni Git klasörleri oluşturmalarını önerir. Git depolarını ve diğer çalışma alanı varlıklarını birlikte konumlandırmak, Git klasörlerini Depolar'a göre daha bulunabilir ve daha kolay yönetilebilir hale getirir.
Git klasörü izinleri Git klasörleri, diğer çalışma alanı klasörleriyle aynı çalışma alanı klasörü izinlerine sahiptir. Kullanıcıların, Git işlemlerinin CAN_MANAGE
çoğunu gerçekleştirmek için izinlere sahip olması gerekir.
Git klasörlerinde kod çalıştırmak için hangi DBR'i kullanmalıyım?
Databricks, Git klasörleriyle eski Depolar arasında tutarlı kod yürütme için kullanıcıların yalnızca DBR 15+ bulunan Git klasörlerinde kod çalıştırmasını önerir.
Geçerli çalışma dizini (CWD) davranışı
Databricks Runtime (DBR) sürüm 14 veya üzeri göreli yolların kullanılmasına olanak tanır ve not defterini geçerli çalışma dizininden çalıştırdığınız tüm not defterleri için aynı geçerli çalışma dizini (CWD) deneyimini sağlar. Databricks Runtime'ın (DBR) eski sürümleri için Git klasöründeki ve Git olmayan bir klasördeki not defterleri arasında geçerli çalışma dizini (CWD) davranışları tutarsız olabilir.
Python sys.path davranışı
Databricks Runtime (DBR) sürüm 14.3 veya üzeri, Git klasörlerinde eski Depolardakiyle aynı sys.path
davranışı sağlar. Önceki DBR sürümlerinde, Git klasörleri için kök depo dizini otomatik olarak eklenmediğinden sys.path
Git klasörü davranışı eski Depolardan farklıdır. Python için, sys.path
yorumlayıcının modülleri içeri aktarırken arayabilecekleri dizinlerin listesini içerir. DBR 15 veya üzerini kullanamıyorsanız, geçici çözüm olarak klasörün yolunu sys.path
el ile ekleyebilirsiniz.
Göreli yolları kullanarak dizin sys.path
ekleme örnekleri için bkz . Python ve R modüllerini içeri aktarma.
Python kitaplığı önceliği
Databricks Runtime (DBR) sürüm 14.3 veya üzeri, Git klasörlerinde eski Depolardakiyle aynı Python kitaplığı önceliğini sağlar.