หมายเหตุ
การเข้าถึงหน้านี้ต้องได้รับการอนุญาต คุณสามารถลอง ลงชื่อเข้าใช้หรือเปลี่ยนไดเรกทอรีได้
การเข้าถึงหน้านี้ต้องได้รับการอนุญาต คุณสามารถลองเปลี่ยนไดเรกทอรีได้
นําไปใช้กับ:✅ จุดสิ้นสุดการวิเคราะห์ SQL และ Warehouse ใน Microsoft Fabric
บทความนี้อธิบายถึงสถาปัตยกรรมและการจัดการปริมาณงานใน Fabric Data Warehouse
การประมวลผลข้อมูล
จุดสิ้นสุด Warehouse และ SQL analytics จะแชร์สถาปัตยกรรมการประมวลผลพื้นฐานเดียวกัน เมื่อ Fabric ดึงข้อมูลหรือนําเข้าข้อมูล กลไกจัดการแบบกระจายจะจัดการข้อมูลและฟังก์ชันการคํานวณทั้งขนาดเล็กและขนาดใหญ่
ระบบการประมวลผลนั้นไม่มีเซิร์ฟเวอร์ในความจุการคํานวณ Backend จะปรับขนาดขึ้นและลงโดยอัตโนมัติเพื่อตอบสนองความต้องการปริมาณงาน
เมื่อมีการส่งคิวรี SQL frontend (FE) ดําเนินการปรับคิวรีให้เหมาะสมเพื่อกําหนดแผนที่ดีที่สุดตามขนาดข้อมูลและความซับซ้อน เมื่อสร้างแผนแล้ว แผนจะถูกมอบให้กับกลไกจัดการการประมวลผลแบบสอบถามแบบกระจาย (DQP) DQP จะกระจายการดําเนินการของคิวรีโดยแยกออกเป็นคิวรีที่มีขนาดเล็กกว่าที่ดําเนินการบนโหนดการคํานวณ Backend คิวรีขนาดเล็กแต่ละรายการเป็น งาน และแสดงถึงหน่วยการดําเนินการแบบกระจาย อ่านไฟล์จาก OneLake รวมผลลัพธ์จากงาน กลุ่ม หรือสั่งซื้อข้อมูลที่ดึงมาจากงานอื่นๆ สําหรับงานการนําเข้า ระบบยังเขียนข้อมูลไปยังตารางปลายทางที่เหมาะสม
เมื่อข้อมูลถูกประมวลผล ผลลัพธ์จะถูกส่งกลับไปยัง SQL frontend สําหรับการให้บริการกลับไปยังผู้ใช้หรือการเรียกแอปพลิเคชัน
ความยืดหยุ่นและความยืดหยุ่น
ประโยชน์ของความจุการคํานวณ Backend จากสถาปัตยกรรมที่จัดเตรียมไว้อย่างรวดเร็ว แม้ว่าจะไม่มี SLA ในการมอบหมายทรัพยากร แต่โดยทั่วไปแล้วโหนดใหม่จะได้รับภายในไม่กี่วินาที เมื่อความต้องการทรัพยากรเพิ่มขึ้น ปริมาณงานใหม่จะใช้ความจุแบบปรับมาตราส่วนออก การปรับมาตราส่วนเป็นการดําเนินการออนไลน์และการประมวลผลคิวรีไม่มีการขัดจังหวะ
ระบบไม่ทนต่อความผิดพลาดและหากโหนดไม่แข็งแรงการดําเนินการที่ดําเนินการบนโหนดจะถูกแจกจ่ายต่อไปยังโหนดสุขภาพเพื่อความสมบูรณ์
ตําแหน่งข้อมูลการวิเคราะห์คลังสินค้าและ SQL ให้ ความจุแบบขยายได้ ซึ่งช่วยให้ปริมาณงานใช้ทรัพยากรได้มากขึ้นเพื่อให้ได้ประสิทธิภาพที่ดีขึ้นและใช้ การปรับให้เรียบ เพื่อบรรเทาความเดือดร้อนให้กับลูกค้าที่สร้างการเพิ่มขึ้นอย่างกะทันหันในช่วงเวลาเร่งด่วนและมีความจุที่ไม่ได้ใช้งานในช่วงเวลาอื่น การทําให้การจัดการความจุง่ายขึ้นโดยการเผยแพร่การประเมินการคํานวณเพื่อให้แน่ใจว่างานของลูกค้าทํางานได้อย่างราบรื่นและมีประสิทธิภาพ
การจัดกําหนดการและการจัดหาใหม่
ตัวจัดกําหนดการการประมวลผลคิวรีแบบกระจายดําเนินการในระดับงาน คิวรีจะถูกแสดงเป็นตัวจัดกําหนดการเป็นกราฟอซิกลิก (DAG) ที่มีคําสั่งของงาน แนวคิดนี้คุ้นเคยกับผู้ใช้ Spark DAG ช่วยให้สามารถขนานกันและทํางานพร้อมกันได้ เนื่องจากงานที่ไม่ขึ้นอยู่กับกันสามารถดําเนินการพร้อมกันหรือไม่เป็นระเบียบ
เมื่อคิวรี่มาถึง งานของพวกเขาจะถูกจัดกําหนดการตามหลักการเข้าก่อนออกก่อน (FIFO) ถ้ามีความจุที่ไม่ได้ใช้งาน ตัวจัดกําหนดการอาจใช้วิธีการ "เหมาะสมที่สุด" เพื่อเพิ่มประสิทธิภาพการทํางานพร้อมกัน
เมื่อตัวจัดกําหนดการระบุถึงแรงกดดันในการจัดหาใหม่ จะเรียกใช้การดําเนินการปรับมาตราส่วน การปรับมาตราส่วนได้รับการจัดการโดยอัตโนมัติ และโทโพโลยี Backend จะเพิ่มขึ้นเมื่อภาวะพร้อมกันเพิ่มขึ้น เนื่องจากใช้เวลาสองถึงสามวินาทีในการรับโหนด ระบบไม่ได้รับการปรับให้เหมาะสมเพื่อประสิทธิภาพการทํางานที่ต่ํากว่าระดับต่ํากว่าที่สอดคล้องกันของคิวรีที่จําเป็นต้องมีการประมวลผลแบบกระจาย
เมื่อความดันลดลง โทโพโลยี Backend จะปรับขนาดกลับลงและปล่อยทรัพยากรกลับไปยังภูมิภาค
การแยกพูลการประมวลผล
นําไปใช้กับ:✅ Warehouse ใน Microsoft Fabric
SKU ความจุที่กําหนดให้กับพื้นที่ทํางานจะกําหนดการประมวลผลทั้งหมดที่พร้อมใช้งานสําหรับตําแหน่งข้อมูลการวิเคราะห์ SQL การประมวลผลนี้แบ่งเท่าๆ กัน (50/50) ออกเป็นพูลทรัพยากรที่แยกจากกันสองพูลสําหรับคิวรีของผู้ใช้เพื่อใช้:
-
SELECT Pool - จัดการคิวรีทั้งหมด
SELECT -
พูลที่ไม่ใช่ SELECT - จัดการการที่ไม่ใช่คิวรีทั้งหมด
SELECTเช่น ETL หรือการดําเนินการนําเข้า
แต่ละพูลจะปรับขนาดอย่างอิสระตามความต้องการคิวรี แต่ไม่เกิน 50% ของการประมวลผลทั้งหมดสําหรับตําแหน่งข้อมูลการวิเคราะห์ SQL การแยกนี้ป้องกันการแย่งชิงทรัพยากร ทําให้มั่นใจได้ว่าปริมาณงานการนําเข้าจะทํางานบนการประมวลผลเฉพาะที่ปรับให้เหมาะสมสําหรับ ETL โดยไม่ส่งผลกระทบต่อการสืบค้นการอ่าน ผลลัพธ์ที่ได้คือประสิทธิภาพและความน่าเชื่อถือที่ดีขึ้นสําหรับคิวรีทั้งสองชนิด
หมายเหตุ
SELECTการแยกและไม่ใช่SELECTพูลเป็นการจัดการปริมาณงานอัตโนมัติเริ่มต้นที่ใช้กับทุกพื้นที่ทํางาน อย่างไรก็ตาม ผู้ดูแลระบบพื้นที่ทํางานสามารถกําหนดสิ่งนี้เองได้โดยใช้พูล SQL แบบกําหนดเอง
เซสชัน
ตําแหน่งข้อมูลการวิเคราะห์คลังสินค้าและ SQL มีขีดจํากัดเซสชันของผู้ใช้ที่ 724 ต่อพื้นที่ทํางาน เมื่อถึงขีดจํากัดนี้ ข้อผิดพลาดจะถูกส่งกลับ: The user session limit for the workspace is 724 and has been reached
หมายเหตุ
เนื่องจาก Microsoft Fabric เป็นแพลตฟอร์ม SaaS มีการเชื่อมต่อระบบมากมายที่ทํางานเพื่อปรับสภาพแวดล้อมให้เหมาะสมอย่างต่อเนื่อง DMV แสดงทั้งเซสชันระบบและผู้ใช้ สําหรับข้อมูลเพิ่มเติม โปรดดู ตรวจสอบการเชื่อมต่อ เซสชัน และคําขอโดยใช้ DMV
แนวทางปฏิบัติ
พื้นที่ทํางาน Microsoft Fabric ให้ขอบเขตการแยกตามธรรมชาติของระบบคํานวณแบบกระจาย ปริมาณงานสามารถใช้ประโยชน์จากขอบเขตนี้เพื่อจัดการทั้งต้นทุนและประสิทธิภาพการทํางาน
ทางลัด OneLake สามารถใช้เพื่อสร้างแบบจําลองแบบอ่านอย่างเดียวของตารางในพื้นที่ทํางานอื่นเพื่อกระจายโหลดข้ามกลไกจัดการ SQL หลายตัว โดยสร้างขอบเขตการแยก ซึ่งสามารถเพิ่มจํานวนสูงสุดของเซสชันที่กําลังดําเนินการคิวรีแบบอ่านอย่างเดียวได้อย่างมีประสิทธิภาพ