ใช้คุณลักษณะการบํารุงรักษาตารางเพื่อจัดการตาราง delta ใน Fabric
Lakehouse ใน Microsoft Fabric มีคุณลักษณะการบํารุงรักษาตารางเพื่อให้สามารถจัดการตารางเดลต้าได้อย่างมีประสิทธิภาพและเพื่อให้พร้อมสําหรับการวิเคราะห์อยู่เสมอ คู่มือนี้อธิบายถึงคุณลักษณะการบํารุงรักษาตารางใน Lakehouse และความสามารถของเลคเฮ้าส์
ความสามารถที่สําคัญของตารางทะเลสาบคุณลักษณะการบํารุงรักษา:
- ดําเนินการบํารุงรักษาตารางเฉพาะโดยใช้การดําเนินการคลิกขวาตามบริบทในตาราง delta ภายใน Lakehouse explorer
- ใช้การกระชับช่องเก็บ V-Order และการล้างข้อมูลไฟล์เก่าที่ไม่ถูกเฟรนด์
หมายเหตุ
สําหรับงานบํารุงรักษาขั้นสูง เช่น การจัดกลุ่มคําสั่งการบํารุงรักษาตารางหลายรายการ การเรียงลําดับตามกําหนดการ วิธีการที่เน้นโค้ดเป็นตัวเลือกที่แนะนํา หากต้องการเรียนรู้เพิ่มเติม ดู บทความการปรับตาราง Delta Lake ให้เหมาะสมและการสั่งซื้อ V นอกจากนี้ยังเป็นไปได้ที่จะใช้ Lakehouse API เพื่อทําให้การดําเนินงานการบํารุงรักษาตารางเป็นแบบอัตโนมัติเพื่อเรียนรู้เพิ่มเติม ดูจัดการเลคเฮ้าส์ด้วย Microsoft Fabric REST API
ชนิดไฟล์ที่รองรับ
การบํารุงรักษา ตารางเลคเฮ้าส์ใช้ได้เฉพาะกับตารางทะเลสาบเดลต้าเท่านั้น ตาราง Hive แบบดั้งเดิมที่ใช้ PARQUET, ORC, AVRO, CSV และรูปแบบอื่น ๆ ไม่ได้รับการสนับสนุน
การดําเนินการบํารุงรักษาตาราง
คุณลักษณะการบํารุงรักษาตารางมีการดําเนินงานสามอย่างได้แก่
- ปรับให้เหมาะสม: รวมไฟล์ Parquet ขนาดเล็กหลายไฟล์ลงในไฟล์ขนาดใหญ่ กลไกการประมวลผลข้อมูลขนาดใหญ่และเครื่องยนต์ผ้าทั้งหมดได้รับประโยชน์จากการมีขนาดไฟล์ขนาดใหญ่ การมีไฟล์ที่มีขนาดมากกว่า 128 MB และอยู่ใกล้กับ 1 GB อย่างเหมาะสม ช่วยปรับปรุงการบีบอัดและการกระจายข้อมูลทั่วทั้งโหนดคลัสเตอร์ จึงช่วยลดความจําเป็นในการสแกนไฟล์ขนาดเล็กจํานวนมากสําหรับการดําเนินการอ่านที่มีประสิทธิภาพ นี่คือแนวทางปฏิบัติทั่วไปในการเรียกใช้กลยุทธ์การปรับให้เหมาะสมหลังจากโหลดตารางขนาดใหญ่
- V-Order: ใช้การเรียงลําดับการเข้ารหัสและการบีบอัดที่เหมาะสมกับไฟล์ Delta parquet เพื่อให้สามารถอ่านได้อย่างรวดเร็วทั่วทั้งกลไกจัดการ Fabric ทั้งหมด การสั่งซื้อ V เกิดขึ้นในระหว่างคําสั่งปรับให้เหมาะสมและจะแสดงเป็นตัวเลือกในกลุ่มคําสั่งในประสบการณ์ของผู้ใช้ หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ V-Order โปรดดูการปรับตาราง Delta Lake ให้เหมาะสมและ V-Order
- สูญญากาศ: ลบไฟล์เก่าที่ไม่อ้างอิงโดยบันทึกตาราง Delta อีกต่อไป ไฟล์จะต้องเก่ากว่าค่าเกณฑ์การเก็บรักษาและค่าเกณฑ์การเก็บรักษาไฟล์เริ่มต้นคือเจ็ดวัน ตารางส่วนที่แตกต่างทั้งหมดใน OneLake มีระยะเวลาการเก็บรักษาข้อมูลเดียวกัน ระยะเวลาการเก็บรักษาไฟล์จะเหมือนกันโดยไม่คํานึงถึงกลไกการคํานวณ Fabric ที่คุณกําลังใช้ การบํารุงรักษานี้เป็นสิ่งสําคัญในการปรับต้นทุนการจัดเก็บให้เหมาะสม การตั้งค่าระยะเวลาการเก็บรักษาที่สั้นลงส่งผลกระทบต่อความสามารถในการเดินทางเวลาของ Delta ถือเป็นแนวทางปฏิบัติทั่วไปในการตั้งค่าช่วงการเก็บข้อมูลเป็นอย่างน้อยเจ็ดวันเนื่องจากสแนปช็อตเก่าและไฟล์ที่ไม่ได้ผูกมัดยังคงสามารถใช้งานได้โดยผู้อ่านและผู้เขียนตารางพร้อมกัน การล้างไฟล์ที่ใช้งานอยู่ด้วยคําสั่งสูญญากาศอาจทําให้ผู้อ่านล้มเหลวหรืออาจทําให้ตารางเสียหายได้หากลบไฟล์ที่ไม่ผูกมัดออก
ดําเนินการบํารุงรักษาตารางเฉพาะกิจบนตาราง Delta โดยใช้ Lakehouse
วิธีการใช้ฟีเจอร์:
จากบัญชี Microsoft Fabric ของคุณ นําทางไปยังเลคเฮ้าส์ที่ต้องการ
จากส่วน ตาราง ของ Lakehouse explorer คลิกขวาบนตารางหรือใช้จุดไข่ปลาเพื่อเข้าถึงเมนูตามบริบท
เลือกรายการเมนูการบํารุงรักษา
ตรวจสอบตัวเลือกการบํารุงรักษาในกล่องโต้ตอบตามความต้องการของคุณ สําหรับข้อมูลเพิ่มเติม ดูที่ ส่วน การดําเนินการ บํารุงรักษาตาราง ของบทความนี้
เลือก เรียกใช้ทันที เพื่อดําเนินการงานการบํารุงรักษาตาราง
ติดตามการดําเนินการงานบํารุงรักษาโดยบานหน้าต่างการแจ้งเตือนหรือฮับการตรวจสอบ
การบํารุงรักษาตารางทํางานอย่างไร
หลังจาก เรียกใช้ทันที ถูกเลือก งานการบํารุงรักษา Spark จะถูกส่งสําหรับการดําเนินการ
- ส่งงาน Spark โดยใช้สิทธิพิเศษของข้อมูลประจําตัวผู้ใช้และตาราง
- งาน Spark ใช้ความจุ Fabric ของพื้นที่ทํางาน/ผู้ใช้ที่ส่งงาน
- ถ้ามีงานบํารุงรักษาอื่นที่กําลังทํางานอยู่บนตาราง งานใหม่จะถูกปฏิเสธ
- งานบนตารางที่แตกต่างกันสามารถดําเนินการพร้อมกันได้
- งานบํารุงรักษาตารางสามารถติดตามได้ง่ายในฮับการตรวจสอบ ค้นหาข้อความ "TableMaintenance" ภายในคอลัมน์ชื่อกิจกรรมในหน้าหลักของฮับการตรวจสอบ