ทําความเข้าใจกับ V-Order สําหรับ Microsoft Fabric Warehouse
นําไปใช้กับ:✅ Warehouse ใน Microsoft Fabric
โกดังในที่เก็บข้อมูล Microsoft Fabric ใช้รูปแบบตาราง Delta Lake สําหรับข้อมูลผู้ใช้ทั้งหมด นอกเหนือจากการปรับให้เหมาะสมตามรูปแบบ Delta แล้ว คลังสินค้าจะใช้การปรับให้เหมาะสมกับที่เก็บข้อมูลเพื่อให้ประสิทธิภาพการทํางานของคิวรีเร็วขึ้นในสถานการณ์การวิเคราะห์ในขณะที่ยังคงยึดตามรูปแบบ Parquet บทความนี้ครอบคลุมถึงการปรับ V-Order write ให้เหมาะสม ประโยชน์ และวิธีการควบคุม
V-Order คือการปรับเวลาการเขียนให้เหมาะสมสําหรับรูปแบบไฟล์ parquet ที่ช่วยให้สามารถอ่านได้อย่างรวดเร็วภายใต้กลไกการคํานวณ Microsoft Fabric เช่น Power BI, SQL, Spark และอื่น ๆ
กลไก Power BI และ SQL ใช้ประโยชน์จากเทคโนโลยี Microsoft Verti-Scan และไฟล์ parquet แบบ V-Ordered เพื่อให้ได้เวลาในการเข้าถึงข้อมูลที่เหมือนหน่วยความจํา Spark และกลไกการคํานวณที่ไม่ใช่ Verti-Scan อื่น ๆ ยังได้รับประโยชน์จากไฟล์ V-Ordered ด้วยค่าเฉลี่ยของเวลาในการอ่านเร็วขึ้น 10% ด้วยสถานการณ์บางอย่างถึง 50%
V-Order ทํางานโดยใช้การเรียงลําดับพิเศษ การกระจายกลุ่มแถว การเข้ารหัสพจนานุกรม และการบีบอัดบนไฟล์ Parquet ด้วยเหตุนี้ กลไกการคํานวณจึงต้องการเครือข่าย ดิสก์ และทรัพยากร CPU น้อยกว่าเพื่ออ่านข้อมูลจากที่เก็บข้อมูล ซึ่งมีประสิทธิภาพและประสิทธิภาพด้านต้นทุน สอดคล้องกับรูปแบบปาร์เกตแบบโอเพนซอร์ส 100% กลไก parquet ทั้งหมดสามารถอ่านเป็นไฟล์ parquet ปกติได้
พิจารณารายการต่อไปนี้ก่อนตัดสินใจที่จะปิดใช้งาน V-Order:
- โหมด Microsoft Fabric Direct Lake ขึ้นอยู่กับ V-Order
- ในคลังสินค้า ผลกระทบของ V-Order บนประสิทธิภาพการทํางานอาจแตกต่างกันไปขึ้นอยู่กับ schema ของตาราง ปริมาณข้อมูล คิวรี และรูปแบบการนําเข้าของคุณ
- ตรวจสอบให้แน่ใจว่าคุณได้ทดสอบ V-Order ว่ามีผลต่อประสิทธิภาพในการนําเข้าข้อมูลและคิวรีของคุณอย่างไรก่อนที่จะตัดสินใจปิดใช้งาน พิจารณาการสร้าง สําเนาของคลังสินค้าทดสอบของคุณโดยใช้ตัวควบคุมแหล่งข้อมูล การปิดใช้งาน V-Order บนสําเนา และการดําเนินการนําเข้าข้อมูลและงานการคิวรีเพื่อทดสอบผลกระทบต่อประสิทธิภาพการทํางาน
พิจารณาผลกระทบของ V-Order สําหรับประสิทธิภาพการทํางานก่อนตัดสินใจว่าการปิดใช้งาน V-Order เหมาะกับคุณหรือไม่
ข้อควรระวัง
ในปัจจุบัน การปิดใช้งาน V-Order สามารถทําได้ที่ระดับคลังสินค้าเท่านั้น และไม่สามารถย้อนกลับได้: เมื่อปิดใช้งานจะไม่สามารถเปิดใช้งานอีกครั้งได้ ผู้ใช้ต้องพิจารณาประสิทธิภาพการทํางานหากพวกเขาเลือกที่จะปิดใช้งาน V-Order ใน Fabric Warehouse
การปิดใช้งาน V-Order อาจเป็นประโยชน์สําหรับคลังที่มีการเขียนจํานวนมาก เช่น สําหรับคลังสินค้าที่มีไว้สําหรับจัดเตรียมข้อมูลเป็นส่วนหนึ่งของกระบวนการนําเข้าข้อมูล ตารางการแบ่งระยะมักจะถูกทิ้งและสร้างขึ้นใหม่ (หรือตัดทอน) เพื่อประมวลผลข้อมูลใหม่ ตารางสเตจจิ้งเหล่านี้อาจอ่านได้เพียงครั้งเดียวหรือสองครั้ง ซึ่งอาจไม่จัดชิดขอบเวลาการนําเข้าที่เพิ่มโดยใช้ V-Order โดยการปิดใช้งาน V-Order และลดเวลาในการนําเข้าข้อมูล เวลาโดยรวมของคุณในการประมวลผลข้อมูลในระหว่างงานการนําเข้าอาจลดลง ในกรณีนี้ คุณควรแบ่งเซกเมนต์คลังสินค้าจัดเตรียมจากคลังสินค้าหลักที่เชื่อมต่อกับผู้ใช้ของคุณ เพื่อให้คิวรีการวิเคราะห์และ Power BI ได้รับประโยชน์จาก V-Order