เลือกโหมดการจัดเก็บข้อมูล

เสร็จสมบูรณ์เมื่อ

การตัดสินใจออกแบบครั้งแรกสําหรับแบบจําลองความหมายใดๆ ใน Microsoft Fabric คือวิธีที่ข้อมูลไหลเข้าสู่แบบจําลอง โหมดที่เก็บข้อมูลที่คุณเลือกจะส่งผลต่อประสิทธิภาพการสืบค้น ความใหม่ของข้อมูล และคุณลักษณะของ Fabric ที่พร้อมใช้งาน ใน Fabric Direct Lake เป็นค่าเริ่มต้น และสําหรับปริมาณงานส่วนใหญ่ เป็นตัวเลือกที่เหมาะสม

โหมด Direct Lake

Direct Lake เป็นโหมดที่เก็บข้อมูลเริ่มต้นสําหรับแบบจําลองความหมายที่สร้างขึ้นใน Microsoft Fabric ซึ่งแตกต่างจากโหมดนําเข้า Direct Lake จะไม่คัดลอกข้อมูลลงในแบบจําลอง ซึ่งแตกต่างจาก DirectQuery ตรงที่ไม่ได้แปลคิวรีเป็น SQL ต้นทาง แต่ Direct Lake จะอ่านตารางเดลต้าโดยตรงจาก OneLake ลงในหน่วยความจํา ซึ่งรวมความเร็วของการนําเข้าเข้ากับความสดใหม่ของ DirectQuery

เมื่อผู้ใช้เปิดรายงานที่ได้รับการสนับสนุนโดยแบบจําลองความหมายของ Direct Lake กลไกจัดการจะโหลดข้อมูลคอลัมน์จากไฟล์ Delta Parquet ตามความต้องการ คุณไม่จําเป็นต้องกําหนดเวลาการรีเฟรชเหมือนที่คุณทํากับโหมดนําเข้า เมื่อตารางเดลต้าพื้นฐานอัปเดต แบบจําลองจะสะท้อนถึงการเปลี่ยนแปลงเหล่านั้น

โมเดล Direct Lake เปิดใช้งานรูปแบบการจัดเก็บโมเดลความหมายขนาดใหญ่โดยอัตโนมัติ การตั้งค่านี้จะลบขีดจํากัดขนาดแบบจําลอง 10 GB และเป็นข้อกําหนดเบื้องต้นสําหรับทั้งการขยายขนาดคิวรีและการเข้าถึงการอ่าน/เขียนปลายทาง XMLA คุณไม่จําเป็นต้องเปิดใช้งานด้วยตนเองสําหรับแบบจําลอง Direct Lake

ตัวเลือกการเชื่อมต่อทะเลสาบโดยตรง

โมเดล Direct Lake สามารถเชื่อมต่อกับข้อมูลผ่านสองเส้นทาง:

  • ตาราง OneLake: โมเดลเชื่อมต่อโดยตรงกับตารางเดลต้าในเลคเฮาส์หรือคลังสินค้า นี่เป็นเส้นทางที่ง่ายที่สุดและทํางานได้ดีเมื่อข้อมูลของคุณอยู่ในที่เก็บข้อมูล Fabric เดียว
  • จุดสิ้นสุดการวิเคราะห์ SQL: แบบจําลองเชื่อมต่อผ่านจุดสิ้นสุด SQL ของเลคเฮาส์หรือคลังสินค้า เส้นทางนี้ช่วยให้สามารถเข้าถึงมุมมอง การสืบค้นข้ามฐานข้อมูล และคุณลักษณะด้านความปลอดภัยที่กําหนดไว้ที่เลเยอร์ SQL

เลือกตาราง OneLake เมื่อข้อมูลของคุณตรงไปตรงมาและอยู่ในที่เดียว เลือกตําแหน่งข้อมูลการวิเคราะห์ SQL เมื่อคุณต้องการมุมมอง การรวมข้ามแหล่งที่มา หรือการรักษาความปลอดภัยระดับแถวที่กําหนดไว้ใน SQL

พฤติกรรมสำรอง

การดําเนินการบางอย่างอาจทําให้แบบจําลอง Direct Lake ถอยกลับไปยังโหมด DirectQuery การคํานวณ DAX ที่ซับซ้อน คิวรีที่เกินหน่วยความจําที่พร้อมใช้งาน หรือการดําเนินการบางอย่างที่ไม่ได้รับการสนับสนุนจะทริกเกอร์การสํารองนี้ เมื่อเกิดการสํารอง คิวรีจะทํางานกับจุดสิ้นสุดการวิเคราะห์ SQL แทนที่จะอ่านไฟล์เดลต้าโดยตรง

คุณสามารถกําหนดค่าลักษณะการทํางานสํารองในการตั้งค่าแบบจําลองความหมาย:

  • อนุญาตสํารอง: คิวรีที่ไม่สามารถเรียกใช้ในโหมด Direct Lake จะย้อนกลับไปยัง DirectQuery โดยอัตโนมัติ ผู้ใช้จะได้รับผลลัพธ์ แต่ประสิทธิภาพอาจลดลง
  • ไม่อนุญาตการสํารอง: การสืบค้นที่ไม่สามารถเรียกใช้ในโหมด Direct Lake จะส่งคืนข้อผิดพลาด ตัวเลือกนี้บังคับใช้ประสิทธิภาพที่สอดคล้องกัน แต่ต้องการให้คิวรีทั้งหมดอยู่ในความสามารถของ Direct Lake

สําหรับปริมาณงานการผลิตส่วนใหญ่ ให้เริ่มต้นด้วยปริมาณงานสํารองที่อนุญาตและตรวจสอบว่าคิวรีใดทริกเกอร์ จากนั้นปรับคิวรีหรือโครงสร้างข้อมูลเหล่านั้นให้เหมาะสมเพื่อลดความถี่สํารองเมื่อเวลาผ่านไป

โหมดการนำเข้า

โหมดนําเข้าจะคัดลอกข้อมูลลงในแบบจําลองความหมายและจัดเก็บในรูปแบบบีบอัดในหน่วยความจํา คิวรีทํางานกับสําเนาภายในเครื่อง ซึ่งทําให้การนําเข้าเป็นโหมดที่เก็บข้อมูลที่เร็วที่สุดสําหรับประสิทธิภาพของคิวรี อย่างไรก็ตาม ข้อมูลจะเป็นปัจจุบันเท่ากับการรีเฟรชครั้งล่าสุดเท่านั้น

โหมดนําเข้าเป็นตัวเลือกที่เหมาะสมเมื่อ:

  • แหล่งข้อมูลของคุณอยู่ภายนอก Fabric (ฐานข้อมูลภายในองค์กร, API ของบุคคลที่สาม, ไฟล์แฟลต)
  • ประสิทธิภาพของคิวรีเป็นสิ่งสําคัญที่สุด และไม่จําเป็นต้องมีความสดใหม่แบบเรียลไทม์
  • คุณต้องการคุณลักษณะที่ยังไม่ได้รับการสนับสนุนใน Direct Lake

คำแนะนำ

เมื่อใช้โหมดนําเข้า ให้เชื่อมต่อกับมุมมองแทนตารางดิบ รวมเฉพาะคอลัมน์ที่จําเป็น และใช้ชนิดข้อมูลที่เหมาะสมเพื่อลดขนาดแบบจําลอง เรียนรู้เพิ่มเติมเกี่ยวกับเทคนิคในการลดข้อมูลที่โหลดลงในโมเดลการนําเข้า

โหมด DirectQuery

DirectQuery ส่งคิวรีโดยตรงไปยังแหล่งข้อมูลในเวลาคิวรี ไม่มีการจัดเก็บข้อมูลในแบบจําลอง ซึ่งทําให้ DirectQuery เหมาะสําหรับสถานการณ์ข้อมูลแบบเรียลไทม์และชุดข้อมูลขนาดใหญ่มากที่ไม่สามารถนําเข้าได้

การแลกเปลี่ยนคือประสิทธิภาพ การโต้ตอบกับรายงานทุกครั้งจะสร้างแบบสอบถามกับระบบต้นทาง DirectQuery ทํางานได้ดีที่สุดเมื่อ:

  • จําเป็นต้องใช้ข้อมูลแบบเรียลไทม์ และแม้แต่ความล่าช้าในการรีเฟรชสั้นๆ ก็ไม่เป็นที่ยอมรับ
  • ปริมาณข้อมูลต้นทางมีขนาดใหญ่เกินไปที่จะนําเข้า และแหล่งข้อมูลอยู่นอก Fabric
  • ข้อกําหนดด้านการกํากับดูแลกําหนดให้ข้อมูลอยู่ที่แหล่งที่มา

คำแนะนำ

สําหรับข้อมูลเพิ่มเติม โปรดดู คําแนะนําแบบจําลอง DirectQuery

โหมดคอมโพสิต

โหมดคอมโพสิตรวมโหมดการจัดเก็บข้อมูลไว้ในรุ่นเดียว บางตารางใช้ นําเข้า ในขณะที่บางตารางใช้ DirectQuery หรือ Direct Lake สิ่งนี้ให้ความยืดหยุ่นสําหรับสถานการณ์ที่ตารางที่แตกต่างกันมีความต้องการด้านประสิทธิภาพและความสดใหม่ที่แตกต่างกัน

ตัวอย่างเช่น ตารางข้อเท็จจริงขนาดใหญ่อาจอยู่ใน Direct Lake ในขณะที่ตารางอ้างอิงขนาดเล็กจากแหล่งข้อมูลภายนอกใช้การนําเข้า โหมดคอมโพสิตยังเปิดใช้งานความสัมพันธ์แบบกลุ่มต่อกลุ่มระหว่างตารางจากแหล่งข้อมูลต่างๆ

ใช้โหมดคอมโพสิตเมื่อ:

  • คุณต้องการข้อมูลจากทั้งแหล่งข้อมูล Fabric และที่ไม่ใช่ Fabric ในรุ่นเดียวกัน
  • บางตารางต้องการข้อมูลแบบเรียลไทม์ในขณะที่บางตารางได้รับประโยชน์จากประสิทธิภาพที่แคชไว้
  • คุณต้องรวมตาราง Direct Lake กับตารางนําเข้าสําหรับการวิเคราะห์ข้ามแหล่งที่มา

เลือกโหมดการจัดเก็บข้อมูลที่เหมาะสม

ตารางต่อไปนี้สรุปเวลาที่ควรเลือกแต่ละโหมด:

โหมด ตำแหน่งที่ตั้งข้อมูล ความเร็วในการสืบค้น ความใหม่ของข้อมูล เหมาะสำหรับ
ทะเลสาบโดยตรง OneLake (ตารางเดลต้า) เร็ว ใกล้เรียลไทม์ ปริมาณงาน Fabric-native (ค่าเริ่มต้น)
นําเข้า แคชในรุ่น เร็วที่สุด ขึ้นอยู่กับการรีเฟรช แหล่งที่มาที่ไม่ใช่ Fabric ประสิทธิภาพสูงสุด
DirectQuery ระบบแหล่งที่มา ขึ้นอยู่กับระบบต้นทาง ใกล้เรียลไทม์ ข้อกําหนดแบบเรียลไทม์ ข้อมูลภายนอกขนาดใหญ่มาก
คอม โพ สิต ผสม แตก ต่าง กัน ผสม สถานการณ์ข้ามแหล่งที่มา ข้อกําหนดแบบไฮบริด

โหมดการจัดเก็บยังส่งผลต่อการใช้ AI เมื่อ Copilot หรือตัวแทนข้อมูลสืบค้นแบบจําลองความหมาย พวกเขาจะส่งคืนคําตอบตามข้อมูลใดๆ ที่โมเดลสะท้อนในปัจจุบัน ความสดใหม่เกือบเรียลไทม์ของ Direct Lake หมายความว่าการสืบค้น AI จะส่งคืนผลลัพธ์ปัจจุบันโดยไม่ต้องรอการรีเฟรชตามกําหนดเวลา สําหรับโมเดลที่ให้บริการทั้งผู้ใช้ที่เป็นมนุษย์และ AI การเลือกโหมดการจัดเก็บข้อมูลจะส่งผลโดยตรงต่อคุณภาพของประสบการณ์ทั้งสอง

ใน Fabric ให้เริ่มต้นด้วย Direct Lake ย้ายไปยังโหมดอื่นเฉพาะเมื่อสถานการณ์เฉพาะของคุณต้องการเท่านั้น