เลือกโหมดการจัดเก็บข้อมูล
การตัดสินใจออกแบบครั้งแรกสําหรับแบบจําลองความหมายใดๆ ใน Microsoft Fabric คือวิธีที่ข้อมูลไหลเข้าสู่แบบจําลอง โหมดที่เก็บข้อมูลที่คุณเลือกจะส่งผลต่อประสิทธิภาพการสืบค้น ความใหม่ของข้อมูล และคุณลักษณะของ Fabric ที่พร้อมใช้งาน ใน Fabric Direct Lake เป็นค่าเริ่มต้น และสําหรับปริมาณงานส่วนใหญ่ เป็นตัวเลือกที่เหมาะสม
โหมด Direct Lake
Direct Lake เป็นโหมดที่เก็บข้อมูลเริ่มต้นสําหรับแบบจําลองความหมายที่สร้างขึ้นใน Microsoft Fabric ซึ่งแตกต่างจากโหมดนําเข้า Direct Lake จะไม่คัดลอกข้อมูลลงในแบบจําลอง ซึ่งแตกต่างจาก DirectQuery ตรงที่ไม่ได้แปลคิวรีเป็น SQL ต้นทาง แต่ Direct Lake จะอ่านตารางเดลต้าโดยตรงจาก OneLake ลงในหน่วยความจํา ซึ่งรวมความเร็วของการนําเข้าเข้ากับความสดใหม่ของ DirectQuery
เมื่อผู้ใช้เปิดรายงานที่ได้รับการสนับสนุนโดยแบบจําลองความหมายของ Direct Lake กลไกจัดการจะโหลดข้อมูลคอลัมน์จากไฟล์ Delta Parquet ตามความต้องการ คุณไม่จําเป็นต้องกําหนดเวลาการรีเฟรชเหมือนที่คุณทํากับโหมดนําเข้า เมื่อตารางเดลต้าพื้นฐานอัปเดต แบบจําลองจะสะท้อนถึงการเปลี่ยนแปลงเหล่านั้น
โมเดล Direct Lake เปิดใช้งานรูปแบบการจัดเก็บโมเดลความหมายขนาดใหญ่โดยอัตโนมัติ การตั้งค่านี้จะลบขีดจํากัดขนาดแบบจําลอง 10 GB และเป็นข้อกําหนดเบื้องต้นสําหรับทั้งการขยายขนาดคิวรีและการเข้าถึงการอ่าน/เขียนปลายทาง XMLA คุณไม่จําเป็นต้องเปิดใช้งานด้วยตนเองสําหรับแบบจําลอง Direct Lake
ตัวเลือกการเชื่อมต่อทะเลสาบโดยตรง
โมเดล Direct Lake สามารถเชื่อมต่อกับข้อมูลผ่านสองเส้นทาง:
- ตาราง OneLake: โมเดลเชื่อมต่อโดยตรงกับตารางเดลต้าในเลคเฮาส์หรือคลังสินค้า นี่เป็นเส้นทางที่ง่ายที่สุดและทํางานได้ดีเมื่อข้อมูลของคุณอยู่ในที่เก็บข้อมูล Fabric เดียว
- จุดสิ้นสุดการวิเคราะห์ SQL: แบบจําลองเชื่อมต่อผ่านจุดสิ้นสุด SQL ของเลคเฮาส์หรือคลังสินค้า เส้นทางนี้ช่วยให้สามารถเข้าถึงมุมมอง การสืบค้นข้ามฐานข้อมูล และคุณลักษณะด้านความปลอดภัยที่กําหนดไว้ที่เลเยอร์ SQL
เลือกตาราง OneLake เมื่อข้อมูลของคุณตรงไปตรงมาและอยู่ในที่เดียว เลือกตําแหน่งข้อมูลการวิเคราะห์ SQL เมื่อคุณต้องการมุมมอง การรวมข้ามแหล่งที่มา หรือการรักษาความปลอดภัยระดับแถวที่กําหนดไว้ใน SQL
พฤติกรรมสำรอง
การดําเนินการบางอย่างอาจทําให้แบบจําลอง Direct Lake ถอยกลับไปยังโหมด DirectQuery การคํานวณ DAX ที่ซับซ้อน คิวรีที่เกินหน่วยความจําที่พร้อมใช้งาน หรือการดําเนินการบางอย่างที่ไม่ได้รับการสนับสนุนจะทริกเกอร์การสํารองนี้ เมื่อเกิดการสํารอง คิวรีจะทํางานกับจุดสิ้นสุดการวิเคราะห์ SQL แทนที่จะอ่านไฟล์เดลต้าโดยตรง
คุณสามารถกําหนดค่าลักษณะการทํางานสํารองในการตั้งค่าแบบจําลองความหมาย:
- อนุญาตสํารอง: คิวรีที่ไม่สามารถเรียกใช้ในโหมด Direct Lake จะย้อนกลับไปยัง DirectQuery โดยอัตโนมัติ ผู้ใช้จะได้รับผลลัพธ์ แต่ประสิทธิภาพอาจลดลง
- ไม่อนุญาตการสํารอง: การสืบค้นที่ไม่สามารถเรียกใช้ในโหมด Direct Lake จะส่งคืนข้อผิดพลาด ตัวเลือกนี้บังคับใช้ประสิทธิภาพที่สอดคล้องกัน แต่ต้องการให้คิวรีทั้งหมดอยู่ในความสามารถของ Direct Lake
สําหรับปริมาณงานการผลิตส่วนใหญ่ ให้เริ่มต้นด้วยปริมาณงานสํารองที่อนุญาตและตรวจสอบว่าคิวรีใดทริกเกอร์ จากนั้นปรับคิวรีหรือโครงสร้างข้อมูลเหล่านั้นให้เหมาะสมเพื่อลดความถี่สํารองเมื่อเวลาผ่านไป
โหมดการนำเข้า
โหมดนําเข้าจะคัดลอกข้อมูลลงในแบบจําลองความหมายและจัดเก็บในรูปแบบบีบอัดในหน่วยความจํา คิวรีทํางานกับสําเนาภายในเครื่อง ซึ่งทําให้การนําเข้าเป็นโหมดที่เก็บข้อมูลที่เร็วที่สุดสําหรับประสิทธิภาพของคิวรี อย่างไรก็ตาม ข้อมูลจะเป็นปัจจุบันเท่ากับการรีเฟรชครั้งล่าสุดเท่านั้น
โหมดนําเข้าเป็นตัวเลือกที่เหมาะสมเมื่อ:
- แหล่งข้อมูลของคุณอยู่ภายนอก Fabric (ฐานข้อมูลภายในองค์กร, API ของบุคคลที่สาม, ไฟล์แฟลต)
- ประสิทธิภาพของคิวรีเป็นสิ่งสําคัญที่สุด และไม่จําเป็นต้องมีความสดใหม่แบบเรียลไทม์
- คุณต้องการคุณลักษณะที่ยังไม่ได้รับการสนับสนุนใน Direct Lake
คำแนะนำ
เมื่อใช้โหมดนําเข้า ให้เชื่อมต่อกับมุมมองแทนตารางดิบ รวมเฉพาะคอลัมน์ที่จําเป็น และใช้ชนิดข้อมูลที่เหมาะสมเพื่อลดขนาดแบบจําลอง เรียนรู้เพิ่มเติมเกี่ยวกับเทคนิคในการลดข้อมูลที่โหลดลงในโมเดลการนําเข้า
โหมด DirectQuery
DirectQuery ส่งคิวรีโดยตรงไปยังแหล่งข้อมูลในเวลาคิวรี ไม่มีการจัดเก็บข้อมูลในแบบจําลอง ซึ่งทําให้ DirectQuery เหมาะสําหรับสถานการณ์ข้อมูลแบบเรียลไทม์และชุดข้อมูลขนาดใหญ่มากที่ไม่สามารถนําเข้าได้
การแลกเปลี่ยนคือประสิทธิภาพ การโต้ตอบกับรายงานทุกครั้งจะสร้างแบบสอบถามกับระบบต้นทาง DirectQuery ทํางานได้ดีที่สุดเมื่อ:
- จําเป็นต้องใช้ข้อมูลแบบเรียลไทม์ และแม้แต่ความล่าช้าในการรีเฟรชสั้นๆ ก็ไม่เป็นที่ยอมรับ
- ปริมาณข้อมูลต้นทางมีขนาดใหญ่เกินไปที่จะนําเข้า และแหล่งข้อมูลอยู่นอก Fabric
- ข้อกําหนดด้านการกํากับดูแลกําหนดให้ข้อมูลอยู่ที่แหล่งที่มา
คำแนะนำ
สําหรับข้อมูลเพิ่มเติม โปรดดู คําแนะนําแบบจําลอง DirectQuery
โหมดคอมโพสิต
โหมดคอมโพสิตรวมโหมดการจัดเก็บข้อมูลไว้ในรุ่นเดียว บางตารางใช้ นําเข้า ในขณะที่บางตารางใช้ DirectQuery หรือ Direct Lake สิ่งนี้ให้ความยืดหยุ่นสําหรับสถานการณ์ที่ตารางที่แตกต่างกันมีความต้องการด้านประสิทธิภาพและความสดใหม่ที่แตกต่างกัน
ตัวอย่างเช่น ตารางข้อเท็จจริงขนาดใหญ่อาจอยู่ใน Direct Lake ในขณะที่ตารางอ้างอิงขนาดเล็กจากแหล่งข้อมูลภายนอกใช้การนําเข้า โหมดคอมโพสิตยังเปิดใช้งานความสัมพันธ์แบบกลุ่มต่อกลุ่มระหว่างตารางจากแหล่งข้อมูลต่างๆ
ใช้โหมดคอมโพสิตเมื่อ:
- คุณต้องการข้อมูลจากทั้งแหล่งข้อมูล Fabric และที่ไม่ใช่ Fabric ในรุ่นเดียวกัน
- บางตารางต้องการข้อมูลแบบเรียลไทม์ในขณะที่บางตารางได้รับประโยชน์จากประสิทธิภาพที่แคชไว้
- คุณต้องรวมตาราง Direct Lake กับตารางนําเข้าสําหรับการวิเคราะห์ข้ามแหล่งที่มา
เลือกโหมดการจัดเก็บข้อมูลที่เหมาะสม
ตารางต่อไปนี้สรุปเวลาที่ควรเลือกแต่ละโหมด:
| โหมด | ตำแหน่งที่ตั้งข้อมูล | ความเร็วในการสืบค้น | ความใหม่ของข้อมูล | เหมาะสำหรับ |
|---|---|---|---|---|
| ทะเลสาบโดยตรง | OneLake (ตารางเดลต้า) | เร็ว | ใกล้เรียลไทม์ | ปริมาณงาน Fabric-native (ค่าเริ่มต้น) |
| นําเข้า | แคชในรุ่น | เร็วที่สุด | ขึ้นอยู่กับการรีเฟรช | แหล่งที่มาที่ไม่ใช่ Fabric ประสิทธิภาพสูงสุด |
| DirectQuery | ระบบแหล่งที่มา | ขึ้นอยู่กับระบบต้นทาง | ใกล้เรียลไทม์ | ข้อกําหนดแบบเรียลไทม์ ข้อมูลภายนอกขนาดใหญ่มาก |
| คอม โพ สิต | ผสม | แตก ต่าง กัน | ผสม | สถานการณ์ข้ามแหล่งที่มา ข้อกําหนดแบบไฮบริด |
โหมดการจัดเก็บยังส่งผลต่อการใช้ AI เมื่อ Copilot หรือตัวแทนข้อมูลสืบค้นแบบจําลองความหมาย พวกเขาจะส่งคืนคําตอบตามข้อมูลใดๆ ที่โมเดลสะท้อนในปัจจุบัน ความสดใหม่เกือบเรียลไทม์ของ Direct Lake หมายความว่าการสืบค้น AI จะส่งคืนผลลัพธ์ปัจจุบันโดยไม่ต้องรอการรีเฟรชตามกําหนดเวลา สําหรับโมเดลที่ให้บริการทั้งผู้ใช้ที่เป็นมนุษย์และ AI การเลือกโหมดการจัดเก็บข้อมูลจะส่งผลโดยตรงต่อคุณภาพของประสบการณ์ทั้งสอง
ใน Fabric ให้เริ่มต้นด้วย Direct Lake ย้ายไปยังโหมดอื่นเฉพาะเมื่อสถานการณ์เฉพาะของคุณต้องการเท่านั้น