Doku Çalışma Zamanı 1.3
Doku çalışma zamanı, Azure ile sorunsuz bir tümleştirme sunar. Apache Spark kullanan hem veri mühendisliği hem de veri bilimi projeleri için gelişmiş bir ortam sağlar. Bu makalede, büyük veri hesaplamaları için en yeni çalışma zamanı olan Fabric Runtime 1.3'ün temel özelliklerine ve bileşenlerine genel bir bakış sağlanmaktadır.
Fabric Runtime 1.3, veri işleme özelliklerinizi geliştirmek için tasarlanmış aşağıdaki bileşenleri ve yükseltmeleri içerir:
- Apache Spark 3.5
- İşletim Sistemi: Mariner 2.0
- Java: 11
- Scala: 2.12.17
- Python: 3.10
- Delta Gölü: 3.0.0
Not
Fabric Runtime 1.3 şu anda deneysel bir genel önizleme aşamasındadır. Daha fazla bilgi edinmek için sınırlamalara ve notlara bakın.
Çalışma zamanı 1.3'i çalışma alanınızla tümleştirmek ve yeni özelliklerini kullanmak için aşağıdaki yönergeleri kullanın:
- Doku çalışma alanınızın içindeki Çalışma Alanı ayarları sekmesine gidin.
- Veri Madenciliği/Bilim sekmesine gidin ve Spark Ayarlar'ı seçin.
- Ortam sekmesini seçin.
- Çalışma Zamanı Sürümleri açılan listesinde 1.3 Deneysel (Spark 3.5, Delta 3 OSS) öğesini seçin ve değişikliklerinizi kaydedin. Bu eylem 1,3'i çalışma alanınız için varsayılan çalışma zamanı olarak ayarlar.
Artık Fabric çalışma zamanı 1.3'te (Spark 3.5 ve Delta Lake 3.0) sunulan en yeni iyileştirmeler ve işlevlerle denemeler yapmaya başlayabilirsiniz.
Önemli
Başlangıç havuzları ilk deneysel sürümün bir parçası olmadığından Spark 3.5 oturumlarının başlatılması şu anda yaklaşık 2-5 dakika sürer.
Deneysel Genel Önizleme
Doku çalışma zamanı 1.3 deneysel aşaması, yeni özelliklere ve Apache Spark API'lerine erken erişim sağlar. Bu, Spark 4.0'daki önemli güncelleştirmeler gelmeden önce kararlılık sunan, Uzun Süreli Destek (LTS) sürümü olan Spark 3.5'i içerir. Önizleme, Scala 2.13 yükseltmesi gibi gelecekteki değişiklikler için sorunsuz bir geçiş ve hazır olma durumu sağlayarak spark tabanlı en son geliştirmeleri hemen kullanmanıza olanak tanır. Ayrıca Azure ekosistemindeki gelişmiş ve güvenilir çözümlerle veri projelerinizi geliştirir.
İpucu
Güncel bilgiler, değişikliklerin ayrıntılı listesi ve Doku çalışma zamanları için belirli sürüm notları için Spark Çalışma Zamanları Yayınları'nı ve Güncelleştirmeler denetleyin ve abone olun.
Sınırlamalar
Fabric Runtime 1.3 şu anda kullanıcıların Spark ve Delta Lake'teki en son özellikleri ve API'leri keşfetmesi ve denemesi için tasarlanmış deneysel bir genel önizleme aşamasındadır. Bu sürüm temel işlevlere erişim sunsa da bazı sınırlamalar vardır:
Spark 3.5 oturumlarını kullanabilir, not defterlerine kod yazabilir, Spark iş tanımlarını zamanlayabilir ve PySpark, Scala ve Spark SQL ile kullanabilirsiniz. Ancak bu erken sürümde R dili sağlanmamıştır.
Pip ve conda ile doğrudan kodunuzda kitaplıkları yükleyebilirsiniz. Spark ayarlarını not defterlerindeki %%configure seçenekleri ve Spark İş Tanımları (SJD) aracılığıyla ayarlayabilirsiniz.
Delta 3.0 OSS ile Lakehouse'da okuyup yazabilirsiniz, ancak V düzeni, yerel Parquet yazma, otomatik tamamlama, yazmayı iyileştirme, düşük karıştırmalı birleştirme, birleştirme, şema evrimi ve zaman yolculuğu gibi bazı gelişmiş özellikler bu erken sürüme dahil değildir.
Spark Danışmanı şu anda kullanılamıyor. Ancak Spark kullanıcı arabirimi ve günlükler gibi izleme araçları bu erken sürümde desteklenir.
Kusto, SQL Analytics, Cosmos DB ve MySQL Java Bağlan or gibi Veri Bilimi tümleştirmeleri Copilot gibi özellikler şu anda bu erken sürümde desteklenmemektedir. Veri Bilimi kitaplıkları PySpark ortamlarında desteklenmez. PySpark yalnızca ek kitaplıklar olmadan yalnızca PySpark'ı içeren temel bir Conda kurulumuyla çalışır.
Ortam yapıtı ve VSCode ile tümleştirmeler bu erken sürümde desteklenmez.
Not
Fikirler platformunda Doku Çalışma Zamanı ile ilgili geri bildiriminizi paylaşın. Bahsettiğiniz sürüm ve sürüm aşamasından bahsetmeyi unutmayın. Topluluk geri bildirimlerine değer verir ve oylara göre iyileştirmelere öncelik vererek kullanıcı gereksinimlerini karşıladığımızdan emin oluruz.
Önemli noktalar
Apache Spark 3.5
Apache Spark 3.5.0 , 3.x serisinin altıncı sürümüdür. Bu sürüm, Jira'da kaydedildiği gibi 1.300'den fazla sorunu ele alan açık kaynak topluluğu içinde kapsamlı bir işbirliği ürünüdür.
Bu sürümde, yapılandırılmış akış için uyumluluk açısından bir yükseltme vardır. Ayrıca, bu sürüm PySpark ve SQL'de işlevselliği genişletmektedir. SQL tanımlayıcı yan tümcesi, SQL işlev çağrılarındaki adlandırılmış bağımsız değişkenler ve HyperLogLog yaklaşık toplamaları için SQL işlevlerinin eklenmesi gibi özellikler ekler. Diğer yeni özellikler arasında Python kullanıcı tanımlı tablo işlevleri, DeepSpeed aracılığıyla dağıtılmış eğitimin basitleştirilmesi ve filigran yayma ve dropDuplicatesWithinWatermark işlemi gibi yeni yapılandırılmış akış özellikleri yer alır.
Tam listeyi ve ayrıntılı değişiklikleri burada kontrol edebilirsiniz: https://spark.apache.org/releases/spark-release-3-5-0.html.
Delta Spark
Delta Lake 3.0, Delta Lake'i biçimler arasında birlikte çalışabilir, daha kolay çalışılabilir ve daha yüksek performanslı hale getirmek için kolektif bir taahhüdü işaret ediyor. Delta Spark 3.0.0, Apache Spark™ 3.5'in üzerine kurulmuştur. Delta Spark maven yapıtı delta-core'dan delta-spark olarak yeniden adlandırıldı.
Tam listeyi ve ayrıntılı değişiklikleri burada kontrol edebilirsiniz: https://docs.delta.io/3.0.0/index.html.
İlgili içerik
- Dokuda Apache Spark Çalışma Zamanları hakkında bilgi edinin - Genel Bakış, Sürüm Oluşturma, Birden Çok Çalışma Zamanı Desteği ve Delta Lake Protokolü Yükseltme
- Spark Core geçiş kılavuzu
- SQL, Veri Kümeleri ve DataFrame geçiş kılavuzları
- Yapılandırılmış Akış geçiş kılavuzu
- MLlib (Machine Learning) geçiş kılavuzu
- PySpark (Spark üzerinde Python) geçiş kılavuzu
- SparkR (R on Spark) geçiş kılavuzu
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin