Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Runtime Fabric menawarkan integrasi yang mulus dengan Azure. Ini menyediakan lingkungan canggih untuk proyek rekayasa data dan ilmu data yang menggunakan Apache Spark. Artikel ini memberikan gambaran umum tentang fitur dan komponen penting Fabric Runtime 1.3, runtime terbaru untuk komputasi big data.
Microsoft Fabric Runtime 1.3 adalah versi runtime GA terbaru dan menggabungkan komponen dan peningkatan berikut yang dirancang untuk meningkatkan kemampuan pemrosesan data Anda:
Apache Spark 3.5
Sistem Operasi: Mariner 2.0
Java: 11
Scala: 2.12.17
Python: 3.11
Danau Delta: 3.2
R: 4.4.1
Petunjuk / Saran
Fabric Runtime 1.3 mencakup dukungan untuk Native Execution Engine, yang dapat secara signifikan meningkatkan performa tanpa lebih banyak biaya. Untuk mengaktifkan mesin eksekusi asli di semua pekerjaan dan buku catatan di lingkungan Anda, navigasikan ke pengaturan lingkungan Anda, pilih Komputasi Spark, buka tab Akselerasi, dan centang Aktifkan mesin eksekusi asli. Setelah Anda menyimpan dan menerbitkan, pengaturan ini diterapkan di seluruh lingkungan, sehingga semua pekerjaan dan buku catatan baru secara otomatis mewarisi dan mendapatkan manfaat dari kemampuan performa yang ditingkatkan.
Mengintegrasikan Runtime 1.3
Gunakan instruksi berikut untuk mengintegrasikan runtime 1.3 ke ruang kerja Anda dan gunakan fitur barunya:
Navigasi ke tab Pengaturan ruang kerja dalam ruang kerja Fabric Anda.
Buka tab Rekayasa Data/Sains dan pilih Pengaturan Spark.
Pilih tabLingkungan.
Di bawah Versi Runtime perluas menu dropdown.
Pilih 1.3 (Spark 3.5, Delta 3.2) dan simpan perubahan Anda. Tindakan ini menetapkan 1.3 sebagai runtime default untuk ruang kerja Anda.
Anda sekarang dapat mulai bekerja dengan peningkatan terbaru dan fungsionalitas yang diperkenalkan dalam fabric runtime 1.3 (Spark 3.5 dan Delta Lake 3.2).
Pelajari tentang Apache Spark 3.5
Apache Spark 3.5.0 adalah versi keenam dalam seri 3.x. Versi ini adalah produk kolaborasi ekstensif dalam komunitas sumber terbuka, mengatasi lebih dari 1.300 masalah seperti yang dicatat di Jira.
Dalam versi ini, ada peningkatan kompatibilitas untuk streaming terstruktur. Selain itu, rilis ini memperluas fungsionalitas dalam PySpark dan SQL. Ini menambahkan fitur seperti klausul pengidentifikasi SQL, argumen bernama dalam panggilan fungsi SQL, dan penyertaan fungsi SQL untuk agregasi perkiraan HyperLogLog.
Kemampuan baru lainnya juga termasuk fungsi tabel yang ditentukan pengguna Python, penyederhanaan pelatihan terdistribusi melalui DeepSpeed, dan kemampuan streaming terstruktur baru seperti penyebaran marka air dan operasi dropDuplicatesWithinWatermark .
Anda dapat memeriksa daftar lengkap dan perubahan terperinci di sini: Rilis Spark 3.5.0.
Pelajari tentang Delta Spark
Delta Lake 3.2 menandai komitmen kolektif untuk membuat Delta Lake dapat dioperasikan di seluruh format, lebih mudah dikerjakan, dan lebih berkinerja. Delta Spark 3.2 dibangun di atas Apache Spark⢠3.5. Artefak maven Delta Spark diganti namanya dari delta-core menjadi delta-spark.
Anda dapat memeriksa daftar lengkap dan perubahan terperinci di sini: https://docs.delta.io/index.html.
Komponen dan Pustaka
Untuk informasi terbaru, daftar perubahan terperinci, dan catatan rilis tertentu untuk runtime Fabric, periksa dan berlangganan Rilis dan Pembaruan Runtime Spark.
Nota
EventHubConnector tidak digunakan lagi dalam Fabric Runtime 1.3 (Spark 3.5) dan akan dihapus dari versi Fabric Runtime di masa mendatang. Pelanggan didorong untuk menggunakan Kafka Spark Connector sebagai gantinya karena Azure Event Hubs sudah kompatibel dengan Kafka. Anda dapat menemukan informasi selengkapnya tentang menggunakan Kafka Spark Connector dengan Event Hubs di sini: Tutorial Event Hubs Kafka Spark
Konten terkait
- Baca tentang Apache Spark Runtimes di Fabric - Gambaran Umum, Penerapan Versi, Dukungan Beberapa Runtime, dan Peningkatan Delta Lake Protocol
- Panduan migrasi Spark Core
- Panduan migrasi SQL, Himpunan Data, dan DataFrame
- Panduan migrasi Streaming Terstruktur
- Panduan migrasi MLlib (Pembelajaran Mesin)
- Panduan migrasi PySpark (Python on Spark)
- Panduan migrasi SparkR (R on Spark)