Çalışma alanı dosyaları nedir?
Çalışma alanı dosyası, Azure Databricks çalışma alanı dosya ağacınızda aşağıdaki gibi listelenen türlerden biri olmayan bir dosyadır:
- Notebooks
- Sorgular
- Panolar
- Genie alanları
- Denemeler
Bu hariç tutulan türler dışında, çalışma alanı dosyaları herhangi bir dosya türü olabilir. Bazı yaygın örnekler aşağıdakileri içermektedir:
.py
özel modüllerde kullanılan dosyalar..md
README.md
gibi dosyalar..csv
veya diğer küçük veri dosyaları..txt
Dosyaları..whl
Kitaplık.- Günlük dosyaları.
Dosyalarla çalışma önerileri için bkz . Birimlerdeki dosyalar ve çalışma alanı dosyaları için öneriler.
Azure Databricks çalışma alanı dosya ağacınız "Databricks Git klasörleri" adlı bir Git deposuna eklenmiş klasörler içerebilir. Dosya türü desteğinde bazı ek sınırlamalar vardır. Git klasörlerinde (eski adıyla "Depolar") desteklenen dosya türlerinin listesi için bkz . Git klasörlerinde desteklenen varlık türleri.
Önemli
Databricks Runtime sürüm 11.2'de çalışma alanı dosyaları varsayılan olarak her yerde etkinleştirilir. Üretim iş yükleri için Databricks Runtime 11.3 LTS veya üzerini kullanın. Bu işleve erişemiyorsanız çalışma alanı yöneticinize başvurun.
Çalışma alanı dosyalarıyla neler yapabilirsiniz?
Azure Databricks, yerleşik bir dosya düzenleyicisi de dahil olmak üzere birçok çalışma alanı dosya türü için yerel geliştirmeye benzer işlevler sağlar. Tüm dosya türleri için tüm kullanım örnekleri desteklenmez.
Not defteri etkileşimlerindeki tanıdık desenleri kullanarak çalışma alanı dosyalarına erişimi oluşturabilir, düzenleyebilir ve yönetebilirsiniz. Yerel geliştirme gibi çalışma alanı dosyalarından kitaplık içeri aktarma işlemleri için göreli yolları kullanabilirsiniz. Daha ayrıntılı bilgi için bkz.
- Çalışma alanı dosyaları temel kullanımı
- Çalışma alanı dosyalarıyla program aracılığıyla etkileşim kurma
- Python ve R modülleriyle çalışma
- Görüntüleri görüntüleme
- Not defterlerini yönetme
- Dosya ACL'leri
Çalışma alanı dosyalarında depolanan init betiklerinin özel davranışları vardır. Herhangi bir Databricks Runtime sürümünde init betiklerini depolamak ve bunlara başvurmak için çalışma alanı dosyalarını kullanabilirsiniz. Bkz. Çalışma alanı dosyalarında başlatma betiklerini depolama.
Not
Databricks Runtime 14.0 ve üzerinde, yerel olarak yürütülen kod için varsayılan geçerli çalışma dizini (CWD), çalıştırılmakta olan not defterini veya betiği içeren dizindir. Bu, Databricks Runtime 13.3 LTS ve altındaki davranışlarda bir değişikliktir. Bkz. Varsayılan geçerli çalışma dizini nedir?.
Sınırlama
- İş akışınız uzak git deposunda bulunan kaynak kodu kullanıyorsa, geçerli dizine yazamaz veya göreli bir yol kullanarak yazamazsınız. Diğer konum seçeneklerine veri yazma.
- Çalışma alanı dosyalarına kaydederken komutları kullanamazsınız
git
. Çalışma alanı dosyalarında dizin oluşturmaya.git
izin verilmez. - Spark yürütücülerini (gibi
spark.read.format("csv").load("file:/Workspace/Users/<user-folder>/data.csv")
) kullanarak çalışma alanı dosyalarından okuma, sunucusuz işlemde desteklenmez. - Yürütücüler çalışma alanı dosyalarına yazamaz.
- Kök klasör altındaki
/Workspace
hedef dizinler için symlink'ler desteklenir. - Databricks Runtime 14.2 ve altındaki paylaşılan erişim moduna sahip kümelerdeki kullanıcı tanımlı işlevlerden (UDF) çalışma alanı dosyalarına erişilemiyor.
Dosya boyutu sınırı
- Çalışma alanı dosya boyutu kullanıcı arabiriminden 500 MB ile sınırlıdır. Bir kümeden yazarken izin verilen dosya boyutu üst sınırı 256 MB'tır.
Dosya erişimi izin sınırı
Etkileşimli işlem için 36 saat sonra ve işler için 30 gün sonra süresi dolan klasörlerdeki /Workspace
dosyalara erişim izni. Databricks, /Workspace dosya erişimine ihtiyaç duyduklarında uzun yürütmelerin iş olarak çalıştırılmasını önerir.
Çalışma alanı dosyalarını etkinleştirme
Databricks çalışma alanınızda not defteri olmayan dosyalar için desteği etkinleştirmek için, Databricks çalışma alanınıza erişimi olan bir not defterinden veya başka bir ortamdan /api/2.0/workspace-conf REST API'sini çağırın. Çalışma alanı dosyaları varsayılan olarak etkindir.
Databricks çalışma alanınızda not defteri olmayan dosyalar için desteği etkinleştirmek veya yeniden etkinleştirmek için öğesini çağırın /api/2.0/workspace-conf
ve anahtarın enableWorkspaceFileSystem
değerini alın. olarak ayarlanırsa true
, not defteri olmayan dosyalar çalışma alanınız için zaten etkindir.
Aşağıdaki örnek, çalışma alanı dosyalarının devre dışı bırakılıp bırakılmadığından ve devre dışı bırakıldıysa yeniden etkinleştirmek için bu API'yi bir not defterinden nasıl çağırabileceğinizi gösterir.