แชร์ผ่าน


ใช้คุณลักษณะการบํารุงรักษาตารางเพื่อจัดการตาราง delta ใน Fabric

Lakehouse ใน Microsoft Fabric มีคุณลักษณะการบํารุงรักษาตารางเพื่อให้สามารถจัดการตารางเดลต้าได้อย่างมีประสิทธิภาพและเพื่อให้พร้อมสําหรับการวิเคราะห์อยู่เสมอ คู่มือนี้อธิบายถึงคุณลักษณะการบํารุงรักษาตารางใน Lakehouse และความสามารถของเลคเฮ้าส์

ความสามารถที่สําคัญของตารางทะเลสาบคุณลักษณะการบํารุงรักษา:

  • ดําเนินการบํารุงรักษาตารางเฉพาะโดยใช้การดําเนินการคลิกขวาตามบริบทในตาราง delta ภายใน Lakehouse explorer
  • ใช้การกระชับช่องเก็บ V-Order และการล้างข้อมูลไฟล์เก่าที่ไม่ถูกเฟรนด์

หมายเหตุ

สําหรับงานบํารุงรักษาขั้นสูง เช่น การจัดกลุ่มคําสั่งการบํารุงรักษาตารางหลายรายการ การเรียงลําดับตามกําหนดการ วิธีการที่เน้นโค้ดเป็นตัวเลือกที่แนะนํา หากต้องการเรียนรู้เพิ่มเติม ดู บทความการปรับตาราง Delta Lake ให้เหมาะสมและการสั่งซื้อ V นอกจากนี้ยังเป็นไปได้ที่จะใช้ Lakehouse API เพื่อทําให้การดําเนินงานการบํารุงรักษาตารางเป็นแบบอัตโนมัติเพื่อเรียนรู้เพิ่มเติม ดูจัดการเลคเฮ้าส์ด้วย Microsoft Fabric REST API

ชนิดไฟล์ที่รองรับ

การบํารุงรักษา ตารางเลคเฮ้าส์ใช้ได้เฉพาะกับตารางทะเลสาบเดลต้าเท่านั้น ตาราง Hive แบบดั้งเดิมที่ใช้ PARQUET, ORC, AVRO, CSV และรูปแบบอื่น ๆ ไม่ได้รับการสนับสนุน

การดําเนินการบํารุงรักษาตาราง

คุณลักษณะการบํารุงรักษาตารางมีการดําเนินงานสามอย่างได้แก่

  • ปรับให้เหมาะสม: รวมไฟล์ Parquet ขนาดเล็กหลายไฟล์ลงในไฟล์ขนาดใหญ่ กลไกการประมวลผลข้อมูลขนาดใหญ่และเครื่องยนต์ผ้าทั้งหมดได้รับประโยชน์จากการมีขนาดไฟล์ขนาดใหญ่ การมีไฟล์ที่มีขนาดมากกว่า 128 MB และอยู่ใกล้กับ 1 GB อย่างเหมาะสม ช่วยปรับปรุงการบีบอัดและการกระจายข้อมูลทั่วทั้งโหนดคลัสเตอร์ จึงช่วยลดความจําเป็นในการสแกนไฟล์ขนาดเล็กจํานวนมากสําหรับการดําเนินการอ่านที่มีประสิทธิภาพ นี่คือแนวทางปฏิบัติทั่วไปในการเรียกใช้กลยุทธ์การปรับให้เหมาะสมหลังจากโหลดตารางขนาดใหญ่
  • V-Order: ใช้การเรียงลําดับการเข้ารหัสและการบีบอัดที่เหมาะสมกับไฟล์ Delta parquet เพื่อให้สามารถอ่านได้อย่างรวดเร็วทั่วทั้งกลไกจัดการ Fabric ทั้งหมด การสั่งซื้อ V เกิดขึ้นในระหว่างคําสั่งปรับให้เหมาะสมและจะแสดงเป็นตัวเลือกในกลุ่มคําสั่งในประสบการณ์ของผู้ใช้ หากต้องการเรียนรู้เพิ่มเติมเกี่ยวกับ V-Order โปรดดูการปรับตาราง Delta Lake ให้เหมาะสมและ V-Order
  • สูญญากาศ: ลบไฟล์เก่าที่ไม่อ้างอิงโดยบันทึกตาราง Delta อีกต่อไป ไฟล์จะต้องเก่ากว่าค่าเกณฑ์การเก็บรักษาและค่าเกณฑ์การเก็บรักษาไฟล์เริ่มต้นคือเจ็ดวัน ตารางส่วนที่แตกต่างทั้งหมดใน OneLake มีระยะเวลาการเก็บรักษาข้อมูลเดียวกัน ระยะเวลาการเก็บรักษาไฟล์จะเหมือนกันโดยไม่คํานึงถึงกลไกการคํานวณ Fabric ที่คุณกําลังใช้ การบํารุงรักษานี้เป็นสิ่งสําคัญในการปรับต้นทุนการจัดเก็บให้เหมาะสม การตั้งค่าระยะเวลาการเก็บรักษาที่สั้นลงส่งผลกระทบต่อความสามารถในการเดินทางเวลาของ Delta ถือเป็นแนวทางปฏิบัติทั่วไปในการตั้งค่าช่วงการเก็บข้อมูลเป็นอย่างน้อยเจ็ดวันเนื่องจากสแนปช็อตเก่าและไฟล์ที่ไม่ได้ผูกมัดยังคงสามารถใช้งานได้โดยผู้อ่านและผู้เขียนตารางพร้อมกัน การล้างไฟล์ที่ใช้งานอยู่ด้วยคําสั่งสูญญากาศอาจทําให้ผู้อ่านล้มเหลวหรืออาจทําให้ตารางเสียหายได้หากลบไฟล์ที่ไม่ผูกมัดออก

ดําเนินการบํารุงรักษาตารางเฉพาะกิจบนตาราง Delta โดยใช้ Lakehouse

วิธีการใช้ฟีเจอร์:

  1. จากบัญชี Microsoft Fabric ของคุณ นําทางไปยังเลคเฮ้าส์ที่ต้องการ

  2. จากส่วน ตาราง ของ Lakehouse explorer คลิกขวาบนตารางหรือใช้จุดไข่ปลาเพื่อเข้าถึงเมนูตามบริบท

  3. เลือกรายการเมนูการบํารุงรักษา

  4. ตรวจสอบตัวเลือกการบํารุงรักษาในกล่องโต้ตอบตามความต้องการของคุณ สําหรับข้อมูลเพิ่มเติม ดูที่ ส่วน การดําเนินการ บํารุงรักษาตาราง ของบทความนี้

  5. เลือก เรียกใช้ทันที เพื่อดําเนินการงานการบํารุงรักษาตาราง

  6. ติดตามการดําเนินการงานบํารุงรักษาโดยบานหน้าต่างการแจ้งเตือนหรือฮับการตรวจสอบ

    สกรีนช็อตที่แสดงกล่องโต้ตอบโหลดไปยังตารางที่มีชื่อตารางที่เติม

การบํารุงรักษาตารางทํางานอย่างไร

หลังจาก เรียกใช้ทันที ถูกเลือก งานการบํารุงรักษา Spark จะถูกส่งสําหรับการดําเนินการ

  1. ส่งงาน Spark โดยใช้สิทธิพิเศษของข้อมูลประจําตัวผู้ใช้และตาราง
  2. งาน Spark ใช้ความจุ Fabric ของพื้นที่ทํางาน/ผู้ใช้ที่ส่งงาน
  3. ถ้ามีงานบํารุงรักษาอื่นที่กําลังทํางานอยู่บนตาราง งานใหม่จะถูกปฏิเสธ
  4. งานบนตารางที่แตกต่างกันสามารถดําเนินการพร้อมกันได้
  5. งานบํารุงรักษาตารางสามารถติดตามได้ง่ายในฮับการตรวจสอบ ค้นหาข้อความ "TableMaintenance" ภายในคอลัมน์ชื่อกิจกรรมในหน้าหลักของฮับการตรวจสอบ