Fabric Spark'ta yüksek eşzamanlılık modu
Yüksek eşzamanlılık modu, kullanıcıların veri mühendisliği ve veri bilimi iş yükleri için Fabric Spark'ta aynı Spark oturumlarını paylaşmasına olanak tanır. Not defteri gibi bir öğe, yürütülmesi için standart bir Spark oturumu kullanır. Yüksek eşzamanlılık modunda Spark oturumu, Spark uygulamasında bulunan tek tek okuma-değerlendirme-yazdırma döngüsü (REPL) çekirdekleri içinde birden çok öğenin bağımsız olarak yürütülmesini destekleyebilir. Bu REPL çekirdekleri her öğe için yalıtım sağlar ve yerel not defteri değişkenlerinin aynı oturumu paylaşan diğer not defterlerinden aynı ada sahip değişkenler tarafından üzerine yazılmasını önler.
Oturum zaten çalıştığından, bu, kullanıcılara oturumu birden çok not defteri arasında yeniden kullanırken anında çalıştırma deneyimi sağlar.
Dekont
Yüksek eşzamanlılık moduna sahip özel havuzlar söz konusu olduğunda, kullanıcılar standart Spark oturumuna kıyasla 36 kat daha hızlı oturum başlatma deneyimine sahip olur.
Önemli
Oturum paylaşım koşulları şunlardır:
- Oturumlar tek bir kullanıcı sınırı içinde olmalıdır.
- Oturumlar aynı varsayılan lakehouse yapılandırmasına sahip olmalıdır.
- Oturumlar aynı Spark işlem özelliklerine sahip olmalıdır.
Spark oturumu başlatma işlemi kapsamında bir REPL çekirdeği oluşturulur. Her yeni öğe aynı oturumu paylaşmaya başladığında ve yürütücüler, Spark uygulamasının içindeki bu REPL çekirdeklerinde çalışan bu not defterlerine FAIR tabanlı olarak ayrılarak açlıktan ölme senaryolarını önler.
İlgili içerik
- Not defterlerinde yüksek eşzamanlılık modunu kullanmaya başlamak için bkz . Yapı not defterleri için yüksek eşzamanlılık modunu yapılandırma.
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin