โหมดการทํางานพร้อมกันสูงใน Apache Spark สําหรับ Fabric

โหมดการทํางานพร้อมกันสูงช่วยให้ปริมาณงาน Spark ที่เข้ากันได้สามารถแชร์เซสชัน Spark ที่ทํางานอยู่หนึ่งเซสชันแทนการเริ่มเซสชันแยกต่างหากสําหรับแต่ละปริมาณงาน โหมดนี้มักใช้สําหรับสถานการณ์สมุดบันทึกและไปป์ไลน์ใน Fabric

บทความนี้ช่วยให้คุณเข้าใจสิ่งต่อไปนี้

โหมดการทํางานพร้อมกันสูงคืออะไร และควรใช้เมื่อใด
ข้อกําหนดสําหรับการแชร์เซสชัน
วิธีการทํางานของการเรียกเก็บเงินสําหรับเซสชันที่ใช้ร่วมกัน

ในโหมดมาตรฐาน แต่ละกิจกรรมสมุดบันทึกหรือไปป์ไลน์จะเริ่มเซสชัน Spark ของตัวเอง ในโหมดการทํางานพร้อมกันสูง แอปพลิเคชัน Spark หนึ่งตัวจะโฮสต์ปริมาณงานหลายรายการโดยกําหนดแต่ละปริมาณงานเป็นคอร์ read-eval-print loop (REPL) ของตัวเอง คอร์ REPL แต่ละคอร์จะแยกสถานะการดําเนินการ ดังนั้นตัวแปรเฉพาะที่ในปริมาณงานหนึ่งจะไม่เขียนทับตัวแปรในปริมาณงานอื่น

เนื่องจากเซสชันที่ใช้ร่วมกันกําลังทํางานอยู่แล้ว ปริมาณงานที่ตามมาจึงสามารถเริ่มต้นได้เร็วขึ้นมาก

หมายเหตุ

สําหรับพูลแบบกําหนดเองที่มีโหมดการทํางานพร้อมกันสูง การเริ่มต้นเซสชันอาจเร็วกว่าเซสชัน Spark มาตรฐานถึง 36 เท่า

ความสามารถหลัก

แผนภาพเน้นลักษณะหลักสามประการของโหมดการทํางานพร้อมกันสูง:

ความปลอดภัย: การแชร์เซสชันจะอยู่ภายในขอบเขตของผู้ใช้คนเดียว
การทํางานหลายอย่างพร้อมกัน: คุณสามารถสลับไปมาระหว่างสมุดบันทึกและทํางานต่อได้โดยไม่ต้องรอให้เซสชัน Spark ใหม่ถูกสร้างขึ้นหรือเริ่มต้น
ประสิทธิภาพด้านต้นทุน: เซสชันที่ใช้ร่วมกันช่วยปรับปรุงการใช้ทรัพยากรและลดต้นทุนการประมวลผลสําหรับปริมาณงานวิศวกรรมข้อมูลและวิทยาศาสตร์ข้อมูล

การแชร์เซสชันจะมีผลเมื่อตรงตามเงื่อนไขเหล่านี้:

เซสชันอยู่ภายในขอบเขตของผู้ใช้คนเดียว
เซสชันใช้การกําหนดค่า Lakehouse เริ่มต้นเดียวกัน
เซสชันใช้การตั้งค่าการประมวลผล Spark เดียวกัน

หากข้อกําหนดใด ๆ แตกต่างกัน Fabric จะเริ่มเซสชัน Spark แยกต่างหาก

ในระหว่างการเริ่มต้นเซสชัน Fabric จะสร้างคอร์ REPL เมื่อปริมาณงานใหม่เข้าร่วมเซสชันที่ใช้ร่วมกัน ผู้ดําเนินการจะถูกจัดสรรโดยใช้การจัดกําหนดการ FAIR ในคอร์ REPL เหล่านั้นเพื่อลดความเสี่ยงจากความอดอยาก

ลักษณะการเรียกเก็บเงิน

เมื่อคุณใช้โหมดการทํางานพร้อมกันสูง เฉพาะสมุดบันทึกหรือกิจกรรมไปป์ไลน์ที่เริ่มต้นที่เริ่มต้นแอปพลิเคชัน Spark ที่ใช้ร่วมกันเท่านั้นที่จะถูกเรียกเก็บเงิน เซสชันที่ตามมาที่ใช้เซสชัน Spark เดียวกันจะไม่มีการเรียกเก็บเงินแยกต่างหาก

ตัวอย่างเช่น

ผู้ใช้เริ่มสมุด บันทึก 1 ซึ่งเริ่มต้นเซสชัน Spark ในโหมดการทํางานพร้อมกันสูง
เซสชันเดียวกันจะถูกแชร์โดย Notebook 2, Notebook 3, Notebook 4 และ Notebook 5
ในกรณีนี้ เฉพาะ Notebook 1 เท่านั้นที่จะถูกเรียกเก็บเงินสําหรับการประมวลผล Spark
สมุดบันทึกที่แชร์ (2 ถึง 5 รายการ) จะไม่ถูกเรียกเก็บเงินทีละรายการ

ลักษณะการทํางานนี้ยังสะท้อนให้เห็นใน เมตริกความจุ ซึ่งการใช้งานจะถูกรายงานกับสมุดบันทึกที่เริ่มต้น

หมายเหตุ

ลักษณะการเรียกเก็บเงินเดียวกันนี้ใช้กับกิจกรรมไปป์ไลน์ เฉพาะสมุดบันทึกหรือกิจกรรมที่เริ่มต้นเซสชัน Spark เท่านั้นที่จะถูกเรียกเก็บเงิน

ตามค่าเริ่มต้น เซสชันการทํางานพร้อมกันสูงจะรองรับสมุดบันทึกสูงสุดห้าเล่มที่แชร์เซสชัน Spark เดียวกัน สําหรับปริมาณงานที่ต้องการความหนาแน่นของโน้ตบุ๊กที่สูงขึ้น เช่น ไปป์ไลน์แบบขนานขนาดใหญ่หรือการวิเคราะห์ระดับองค์กรที่โหลดสูงสุด คุณสามารถเพิ่มขีดจํากัดนี้ได้สูงสุด 50 โน้ตบุ๊กต่อเซสชัน

หมายเหตุ

การอัปเดตนี้ไม่ได้เปลี่ยนขีดจํากัดเริ่มต้นที่ห้า คุณต้องตั้งค่า spark.highConcurrency.max ให้เพิ่มอย่างชัดเจน

ตั้งค่าขีดจํากัดการแชร์เซสชันในรายการ สภาพแวดล้อม ที่สมุดบันทึกหรือสมุดบันทึกที่ทริกเกอร์ไปป์ไลน์ของคุณใช้

ไปที่พื้นที่ทํางานของคุณและเปิดสภาพแวดล้อม
เลือกสภาพแวดล้อมที่แนบมากับสมุดบันทึกหรือไปป์ไลน์ของคุณ
เปิด คุณสมบัติ Spark
เพิ่มคุณสมบัติต่อไปนี้ และตั้งค่าระหว่าง 2 ถึง 50:
```
spark.highConcurrency.max = <value>
```
ตัวอย่างเช่น หากต้องการอนุญาตสมุดบันทึกสูงสุด 20 เล่มต่อเซสชัน ให้ทําดังนี้
```
spark.highConcurrency.max = 20
```
บันทึกและเผยแพร่สภาพแวดล้อม

สมุดบันทึกและกิจกรรมไปป์ไลน์ทั้งหมดที่ใช้สภาพแวดล้อมนี้จะสืบทอดขีดจํากัดที่อัปเดตโดยอัตโนมัติ

สถานการณ์สมมติ	การดําเนินการที่แนะนํา
ไปป์ไลน์แบบขนานขนาดใหญ่พร้อมกิจกรรมโน้ตบุ๊กมากมาย	เพิ่ม `spark.highConcurrency.max` เพื่อลดการกระจายตัวของเซสชัน
ปริมาณงานแบบโต้ตอบที่โหลดสูงสุดกับผู้ใช้พร้อมกันจํานวนมาก	เพิ่มขีดจํากัดเพื่อปรับปรุงเวลาในการได้มาซึ่งเซสชัน
ปริมาณงานที่ละเอียดอ่อนต่อต้นทุน ซึ่งการบรรจุที่หนาแน่นช่วยลดค่าใช้จ่ายในการประมวลผล	ปรับขีดจํากัดให้ตรงกับความต้องการการทํางานพร้อมกันของคุณ
ปริมาณงานที่มีข้อกําหนดการแยกที่เข้มงวด	รักษาขีดจํากัดเริ่มต้นไว้ที่ 5 หรือต่ํากว่า

การเพิ่มขีดจํากัดการแชร์เซสชันจะเปิดใช้งาน:

การรับเซสชันที่เร็วขึ้นระหว่างการโหลดสูงสุดโดยลดเวลารอสําหรับเซสชันใหม่
ความหนาแน่นของโน้ตบุ๊กที่สูงขึ้น โดยไม่แยกส่วนออกเป็นเซสชันแยกกันหลายเซสชัน
การปรับแต่งแบบไดนามิกที่สอดคล้องกับความเข้มข้นของปริมาณงาน ต้นทุน และเป้าหมายด้านราคาและประสิทธิภาพ
ประสิทธิภาพด้านราคาที่ดีขึ้น ในขณะที่รักษาความโดดเดี่ยวและความยุติธรรมในงานต่างๆ

Apache Spark คํานวณใน Microsoft Fabric
เมื่อต้องการเริ่มต้นใช้งานโหมดการทํางานพร้อมกันสูงในสมุดบันทึก ให้ดู กําหนดค่าโหมดการทํางานพร้อมกันสูงสําหรับสมุดบันทึก Fabric
สําหรับลักษณะการโหลดและการแสดงตัวอย่างของ Lakehouse โปรดดู โหมดการทํางานพร้อมกันสูงสําหรับการดําเนินงาน Lakehouse ใน Microsoft Fabric

คำติชม

หน้านี้มีประโยชน์หรือไม่

Last updated on 2026-03-18

โหมดการทํางานพร้อมกันสูงใน Apache Spark สําหรับ Fabric

ความสามารถหลัก

ข้อกําหนดในการแชร์เซสชัน

ลักษณะการเรียกเก็บเงิน

ตัวอย่างเช่น

ขีดจํากัดการแชร์เซสชันแบบไดนามิก

กําหนดค่าขีดจํากัดการแชร์เซสชัน

เมื่อใดที่ควรเพิ่มขีดจํากัดการแชร์เซสชัน

เนื้อหาที่เกี่ยวข้อง

คำติชม

แหล่งทรัพยากรเพิ่มเติม