ภาพรวม Direct Lake
Direct Lake เป็นตัวเลือกโหมดที่เก็บข้อมูลสําหรับตารางในแบบจําลองความหมายของ Power BI ที่ถูกจัดเก็บไว้ในพื้นที่ทํางานของ Microsoft Fabric ซึ่งได้รับการปรับให้เหมาะสมสําหรับข้อมูลขนาดใหญ่ที่สามารถโหลดลงในหน่วยความจําจาก ตาราง Delta ได้อย่างรวดเร็ว ซึ่งจัดเก็บข้อมูลของพวกเขาในไฟล์ Parquet ใน OneLake ซึ่งเป็นร้านค้าเดียวสําหรับข้อมูลการวิเคราะห์ทั้งหมด เมื่อโหลดลงในหน่วยความจําแล้ว แบบจําลองความหมายจะเปิดใช้งานคิวรีที่มีประสิทธิภาพสูง Direct Lake ขจัดความล่าช้าและราคาแพงที่ต้องนําเข้าข้อมูลลงในแบบจําลอง
คุณสามารถใช้โหมดที่เก็บข้อมูล Direct Lake เพื่อเชื่อมต่อกับตารางหรือมุมมองของ Fabric lakehouse หรือ Fabric Warehouse ได้ รายการผ้าทั้งสองและแบบจําลองความหมาย Direct Lake จําเป็นต้องมี สิทธิ์การใช้งานความจุ Fabric
ในบางวิธี แบบจําลองความหมาย Direct Lake จะคล้ายกับ แบบจําลองความหมายการนําเข้า นั่นเป็นเพราะว่าข้อมูลแบบจําลองถูกโหลดลงในหน่วยความจําโดยกลไก VertiPaq สําหรับประสิทธิภาพการทํางานของคิวรีอย่างรวดเร็ว (ยกเว้นในกรณีของ การแสดงแทน DirectQuery ซึ่งจะอธิบายในภายหลังในบทความนี้)
อย่างไรก็ตาม แบบจําลองความหมาย Direct Lake มีความแตกต่างจากแบบจําลองความหมายการนําเข้าด้วยวิธีสําคัญ นั่นเป็นเพราะการดําเนินการรีเฟรชสําหรับแบบจําลองความหมาย Direct Lake นั้นแตกต่างกันตามแนวคิดของการดําเนินการรีเฟรชสําหรับแบบจําลองความหมายการนําเข้า สําหรับแบบจําลองความหมาย Direct Lake การรีเฟรชเกี่ยวข้องกับการดําเนินการเฟรมข้อมูล (อธิบายไว้ในบทความนี้ในภายหลัง) ซึ่งอาจใช้เวลาสองถึงสามวินาทีในการดําเนินการให้เสร็จสมบูรณ์ ซึ่งเป็นการดําเนินการที่มีต้นทุนต่ําซึ่งแบบจําลองความหมายวิเคราะห์เมตาดาต้าของตาราง Delta เวอร์ชันล่าสุด และได้รับการอัปเดตเพื่ออ้างอิงไฟล์ล่าสุดใน OneLake ในทางตรงกันข้าม สําหรับแบบจําลองความหมายการนําเข้า การรีเฟรชจะสร้างสําเนาของข้อมูล ซึ่งอาจใช้เวลามากและใช้แหล่งข้อมูลและทรัพยากรความจุที่สําคัญ (หน่วยความจําและ CPU)
หมายเหตุ
การรีเฟรช แบบเพิ่มหน่วยสําหรับแบบจําลองความหมายการนําเข้าสามารถช่วยลดเวลาการรีเฟรชและการใช้ทรัพยากรความจุ
คุณควรใช้โหมดที่เก็บข้อมูล Direct Lake เมื่อใด
กรณีการใช้งานหลักสําหรับโหมดที่เก็บข้อมูล Direct Lake มักใช้สําหรับโครงการวิเคราะห์ที่ขับเคลื่อนด้วย IT ซึ่งใช้ประโยชน์จากสถาปัตยกรรมที่ขับเคลื่อนด้วยทะเลสาบ ในสถานการณ์นี้ คุณมี- หรือคาดว่าจะสะสม — ปริมาณข้อมูลขนาดใหญ่ใน OneLake การโหลดข้อมูลดังกล่าวอย่างรวดเร็วลงในหน่วยความจํา การดําเนินการรีเฟรชที่ใช้บ่อยและรวดเร็ว การใช้ทรัพยากรความจุที่มีประสิทธิภาพ และประสิทธิภาพการคิวรีอย่างรวดเร็วมีความสําคัญสําหรับกรณีการใช้งานนี้ทั้งหมด
หมายเหตุ
แบบจําลองความหมายของการนําเข้าและ DirectQuery ยังคงเกี่ยวข้องกันใน Fabric และเป็นตัวเลือกที่เหมาะสมของแบบจําลองความหมายสําหรับบางสถานการณ์ ตัวอย่างเช่น โหมดการนําเข้าที่เก็บข้อมูลมักจะทํางานได้ดีกับนักวิเคราะห์แบบบริการตนเองที่ต้องการอิสระและความคล่องตัวในการดําเนินการอย่างรวดเร็วและไม่จําเป็นต้องใช้ IT เพื่อเพิ่มองค์ประกอบข้อมูลใหม่
นอกจากนี้ การรวม OneLake จะเขียนข้อมูลสําหรับตารางในโหมดนําเข้าที่เก็บข้อมูลไปยัง ตาราง Delta ใน OneLake โดยอัตโนมัติโดยไม่เกี่ยวข้องกับความพยายามในการโยกย้ายข้อมูลใด ๆ เมื่อใช้ตัวเลือกนี้ คุณจะสามารถตระหนักถึงประโยชน์มากมายของ Fabric ที่มีให้สําหรับผู้ใช้แบบจําลองความหมายการนําเข้า เช่น การรวมกับ lakehouses ผ่านทางลัด คิวรี SQL สมุดบันทึก และอื่น ๆ เราขอแนะนําให้คุณพิจารณาตัวเลือกนี้เป็นวิธีที่รวดเร็วเพื่อเก็บเกี่ยวประโยชน์ของ Fabric โดยไม่จําเป็นต้องออกแบบคลังข้อมูลที่มีอยู่และ/หรือระบบการวิเคราะห์ของคุณใหม่ทันที
โหมดที่เก็บข้อมูล Direct Lake ยังเหมาะสําหรับการลดเวลาแฝงข้อมูลเพื่อให้ข้อมูลพร้อมใช้งานสําหรับผู้ใช้ทางธุรกิจได้อย่างรวดเร็ว หากตาราง Delta ของคุณได้รับการปรับเปลี่ยนเป็นระยะ ๆ (และสมมติว่าคุณได้ทําการเตรียมข้อมูลในที่จัดเก็บข้อมูลดิบแล้ว) คุณอาจพึ่ง พาการอัปเดต อัตโนมัติเพื่อขัดขวางการปรับเปลี่ยนเหล่านั้น ในกรณีนี้ คิวรีที่ส่งไปยังแบบจําลองความหมายจะส่งกลับข้อมูลล่าสุด ความสามารถนี้ทํางานได้ดีกับคุณลักษณะการ รีเฟรช หน้าอัตโนมัติของรายงาน Power BI
โปรดทราบว่า Direct Lake ขึ้นอยู่กับการเตรียมข้อมูลที่กําลังดําเนินการใน data lake การเตรียมข้อมูลสามารถทําได้โดยใช้เครื่องมือต่าง ๆ เช่น งาน Spark สําหรับ Fabric lakehouses, คําสั่ง T-SQL DML สําหรับคลังสินค้า Fabric, กระแสข้อมูล, ไปป์ไลน์ และอื่น ๆ วิธีนี้ช่วยให้มั่นใจได้ว่าตรรกะการเตรียมข้อมูลจะดําเนินการต่ําที่สุดเท่าที่เป็นไปได้ในสถาปัตยกรรมเพื่อเพิ่มความสามารถในการนํามาใช้ใหม่สูงสุด อย่างไรก็ตาม ถ้าผู้สร้างแบบจําลองความหมายไม่มีความสามารถในการปรับเปลี่ยนรายการแหล่งข้อมูล ตัวอย่างเช่น ในกรณีของนักวิเคราะห์แบบบริการตนเองที่อาจไม่มีสิทธิ์ในการเขียนบน lakehouse ที่จัดการโดย IT โหมดที่เก็บข้อมูลการนําเข้าอาจเป็นตัวเลือกที่ดีกว่า เนื่องจากรองรับการเตรียมข้อมูลโดยใช้ Power Query ซึ่งถูกกําหนดให้เป็นส่วนหนึ่งของแบบจําลองความหมาย
ตรวจสอบให้แน่ใจว่าปัจจัยในสิทธิ์การใช้งานความจุ Fabric ปัจจุบันของคุณและ guardrails ความจุของ Fabric เมื่อคุณพิจารณาโหมดที่เก็บข้อมูล Direct Lake นอกจากนี้ปัจจัยใน ข้อควรพิจารณาและข้อจํากัดซึ่งจะอธิบายไว้ในบทความนี้ในภายหลัง
เคล็ดลับ
เราขอแนะนําให้คุณสร้าง ต้นแบบหรือการพิสูจน์แนวคิด (POC) เพื่อตรวจสอบว่าแบบจําลองความหมาย Direct Lake เป็นโซลูชันที่เหมาะสมหรือไม่ และเพื่อลดความเสี่ยง
วิธีการทํางานของ Direct Lake
โดยทั่วไปคิวรีที่ส่งไปยังแบบจําลองความหมาย Direct Lake จะได้รับการจัดการจากแคชในหน่วยความจําของคอลัมน์ที่มาจากตาราง Delta ที่เก็บข้อมูลพื้นฐานสําหรับตาราง Delta คือไฟล์ Parquet อย่างน้อยหนึ่งไฟล์ใน OneLake ไฟล์ Parquet จัดระเบียบข้อมูลตามคอลัมน์แทนที่จะเป็นแถว แบบจําลองความหมายจะโหลดคอลัมน์ทั้งหมดจากตาราง Delta ลงในหน่วยความจําตามที่จําเป็นโดยคิวรี
แบบจําลองความหมาย Direct Lake อาจใช้ การแสดงแทน DirectQuery ซึ่งเกี่ยวข้องกับการสลับไปยัง โหมด DirectQuery อย่างราบรื่น ข้อมูลสํารอง DirectQuery จะดึงข้อมูลโดยตรงจาก จุดสิ้นสุดการวิเคราะห์ SQL ของเลคเฮ้าส์ หรือคลังสินค้า ตัวอย่างเช่น การใช้แสดงแทนอาจเกิดขึ้นเมื่อตาราง Delta ประกอบด้วยแถวของข้อมูลมากกว่าที่ได้รับการสนับสนุนโดยความจุ Fabric ของคุณ (อธิบายไว้ในบทความนี้ในภายหลัง ) ในกรณีนี้ การดําเนินการ DirectQuery จะส่งคิวรีไปยังจุดสิ้นสุดการวิเคราะห์ SQL การดําเนินการที่ใช้แสดงแทนอาจส่งผลให้ประสิทธิภาพการทํางานของคิวรีช้าลง
แผนภาพต่อไปนี้แสดงวิธีการทํางานของ Direct Lake โดยใช้สถานการณ์สมมติของผู้ใช้ที่เปิดรายงาน Power BI
ไดอะแกรมแสดงการดําเนินการ กระบวนการ และคุณลักษณะของผู้ใช้ต่อไปนี้
รายการ | คำอธิบาย |
---|---|
OneLake คือที่จัดเก็บข้อมูลวิเคราะห์ในรูปแบบ Parquet รูปแบบไฟล์นี้ได้รับการปรับให้เหมาะสําหรับการจัดเก็บข้อมูลสําหรับแบบจําลองความหมาย Direct Lake | |
มีคลังสินค้า Fabric lakehouse หรือ Fabric อยู่ในพื้นที่ทํางานที่อยู่บนความจุ Fabric เลคเฮ้าส์มีจุดสิ้นสุดการวิเคราะห์ SQL ซึ่งให้ประสบการณ์ใช้งาน SQL สําหรับการคิวรี ตาราง (หรือมุมมอง) ให้วิธีการคิวรีตาราง Delta ใน OneLake โดยใช้ Transact-SQL (T-SQL) | |
แบบจําลองความหมาย Direct Lake มีอยู่ในพื้นที่ทํางาน Fabric มันเชื่อมต่อกับตารางหรือมุมมองในเลคเฮ้าส์หรือคลังสินค้า | |
ผู้ใช้เปิดรายงาน Power BI | |
รายงาน Power BI ส่งคิวรี Data Analysis Expressions (DAX) ไปยังแบบจําลองความหมาย Direct Lake | |
เมื่อเป็นไปได้ (และจําเป็น) แบบจําลองความหมายจะโหลดคอลัมน์ลงในหน่วยความจําโดยตรงจากไฟล์ Parquet ที่จัดเก็บไว้ใน OneLake คิวรีจะบรรลุประสิทธิภาพการทํางานในหน่วยความจําซึ่งเร็วมาก | |
แบบจําลองความหมายจะส่งกลับผลลัพธ์คิวรี | |
รายงาน Power BI แสดงวิชวล | |
ในบางกรณี เช่น เมื่อแบบจําลองความหมายเกิน guardrails ของความจุ คิวรีแบบจําลองความหมายจะกลับไปเป็นโหมด DirectQuery โดยอัตโนมัติ ในโหมดนี้ แบบสอบถามจะถูกส่งไปยังจุดสิ้นสุดการวิเคราะห์ SQL ของเลคเฮ้าส์หรือคลังสินค้า | |
คิวรี DirectQuery ที่ส่งไปยังจุดสิ้นสุดการวิเคราะห์ SQL จะคิวรีตาราง Delta ใน OneLake ด้วยเหตุนี้ ประสิทธิภาพการทํางานของคิวรีอาจช้ากว่าคิวรีในหน่วยความจํา |
ส่วนต่อไปนี้อธิบายแนวคิดและฟีเจอร์ของ Direct Lake รวมถึงการโหลดคอลัมน์ การเฟรมมิ่ง การอัปเดตอัตโนมัติ และการสํารอง DirectQuery
การโหลดคอลัมน์ (การแปลงรหัส)
แบบจําลองความหมาย Direct Lake จะโหลดข้อมูลจาก OneLake เช่นเดียวกับและเมื่อมีการคิวรีคอลัมน์เป็นครั้งแรกเท่านั้น กระบวนการโหลดข้อมูลตามความต้องการจาก OneLake เรียกว่า การแปลงรหัส
เมื่อแบบจําลองความหมายได้รับคิวรี DAX (หรือนิพจน์หลายมิติ — MDX) จะกําหนดว่าคอลัมน์ใดที่จําเป็นในการสร้างผลลัพธ์คิวรีก่อน คอลัมน์ที่จําเป็นประกอบด้วยคอลัมน์ใด ๆ ที่คิวรีใช้โดยตรง และคอลัมน์ที่ต้องใช้โดยความสัมพันธ์และหน่วยวัด โดยทั่วไปแล้ว จํานวนคอลัมน์ที่จําเป็นในการสร้างผลลัพธ์ของคิวรีจะน้อยกว่าจํานวนคอลัมน์ที่กําหนดไว้ในแบบจําลองความหมายมาก
เมื่อเข้าใจว่าคอลัมน์ใดที่จําเป็น แบบจําลองความหมายจะกําหนดว่าคอลัมน์ใดที่อยู่ในหน่วยความจําอยู่แล้ว ถ้าคอลัมน์ใด ๆ ที่จําเป็นสําหรับคิวรีไม่ได้อยู่ในหน่วยความจํา แบบจําลองความหมายจะโหลดข้อมูลทั้งหมดสําหรับคอลัมน์เหล่านั้นจาก OneLake การโหลดข้อมูลคอลัมน์มักจะเป็นการดําเนินการที่รวดเร็วมาก อย่างไรก็ตามอาจขึ้นอยู่กับปัจจัยต่าง ๆ เช่น คาร์ดินาลลิตี้ของข้อมูลที่จัดเก็บไว้ในคอลัมน์
คอลัมน์ที่โหลดลงในหน่วยความจําจะ อยู่ใน หน่วยความจํา คิวรีในอนาคตที่เกี่ยวข้องกับคอลัมน์ที่มีถิ่นที่อยู่เท่านั้นที่ไม่จําเป็นต้องโหลดคอลัมน์เพิ่มเติมลงในหน่วยความจํา
คอลัมน์ยังคงมีถิ่นที่อยู่จนกว่าจะมีเหตุผลที่จะลบ (ลบ) ออกจากหน่วยความจํา สาเหตุที่คอลัมน์อาจถูกลบออก ประกอบด้วย:
- มีการรีเฟรชแบบจําลองหรือตาราง (ดู การกําหนด เฟรมในส่วนถัดไป)
- ไม่มีการใช้คอลัมน์ดังกล่าวในบางครั้ง
- เหตุผลในการจัดการหน่วยความจําอื่น ๆ รวมถึงความดันหน่วยความจําในความจุเนื่องจากการดําเนินการพร้อมกันอื่น ๆ
ตัวเลือก Fabric SKU ของคุณจะกําหนดหน่วยความจําที่มีอยู่สูงสุดสําหรับแต่ละแบบจําลองความหมาย Direct Lake บนความจุ สําหรับข้อมูลเพิ่มเติมเกี่ยวกับตัวป้องกันทรัพยากรและขีดจํากัดหน่วยความจําสูงสุด โปรดดู ที่ตัวป้องกันความจุของ Fabric และข้อจํากัด ในภายหลังในบทความนี้
กรอบ
การเฟรมมิ่ง ช่วยให้เจ้าของแบบจําลองสามารถควบคุมข้อมูลที่จะโหลดลงในแบบจําลองความหมายได้ การเฟรมมิ่งเป็นการดําเนินการของ Direct Lake ที่ทริกเกอร์โดยการรีเฟรชแบบจําลองความหมาย และในกรณีส่วนใหญ่จะใช้เวลาดําเนินการเพียงไม่กี่วินาทีในการดําเนินการให้เสร็จสมบูรณ์ นั่นเป็นเพราะเป็นการดําเนินงานที่มีต้นทุนต่ําซึ่งแบบจําลองความหมายวิเคราะห์เมตาดาต้าของตาราง Delta Lake เวอร์ชันล่าสุดและได้รับการอัปเดตเพื่ออ้างอิงไฟล์ Parquet ล่าสุดใน OneLake
เมื่อเกิดเฟรมมิ่ง คอลัมน์ที่มีถิ่นที่อยู่อาจถูกลบออกจากหน่วยความจําและจุดในเวลาของการรีเฟรชจะกลายเป็นข้อมูลพื้นฐานใหม่สําหรับเหตุการณ์การแปลงรหัสในอนาคตทั้งหมด จากจุดนี้ คิวรี Direct Lake จะพิจารณาเฉพาะข้อมูลในตาราง Delta ตามเวลาของการดําเนินการเฟรมล่าสุด ด้วยเหตุนี้ ตาราง Direct Lake จะได้รับการคิวรีให้ส่งกลับข้อมูลตามสถานะของตาราง Delta ที่จุดของการดําเนินการเฟรมมิ่งล่าสุด เวลาดังกล่าวไม่จําเป็นต้องเป็นสถานะล่าสุดของตาราง Delta
แผนภาพต่อไปนี้แสดงวิธีการทํางานของการดําเนินการเฟรมมิ่ง Direct Lake
แผนภาพแสดงกระบวนการและคุณลักษณะต่อไปนี้
รายการ | คำอธิบาย |
---|---|
มีแบบจําลองความหมายอยู่ในพื้นที่ทํางาน Fabric | |
การดําเนินการเฟรมจะเกิดขึ้นเป็นระยะ ๆ และตั้งค่าข้อมูลพื้นฐานสําหรับเหตุการณ์การแปลงรหัสในอนาคตทั้งหมด การดําเนินการเฟรมอาจเกิดขึ้นโดยอัตโนมัติ ด้วยตนเอง ตามกําหนดการ หรือทางโปรแกรม | |
OneLake จัดเก็บเมตาดาต้าและไฟล์ Parquet ซึ่งแสดงเป็นตาราง Delta | |
การดําเนินการเฟรมล่าสุดรวมถึงไฟล์ Parquet ที่เกี่ยวข้องกับตาราง Delta และโดยเฉพาะอย่างยิ่งไฟล์ Parquet ที่ถูกเพิ่มก่อนการดําเนินการเฟรมล่าสุด | |
การดําเนินการเฟรมในภายหลังรวมถึงไฟล์ Parquet ที่เพิ่มหลังจากการดําเนินการเฟรมล่าสุด | |
คอลัมน์ที่อยู่ในรูปแบบความหมายของ Direct Lake อาจถูกลบออกจากหน่วยความจํา และจุดในเวลาของการรีเฟรชจะกลายเป็นข้อมูลพื้นฐานใหม่สําหรับเหตุการณ์การแปลงรหัสในอนาคตทั้งหมด | |
การปรับเปลี่ยนข้อมูลที่ตามมาซึ่งแสดงด้วยไฟล์ Parquet ใหม่จะไม่สามารถมองเห็นได้จนกว่าจะมีการดําเนินการเฟรมถัดไปเกิดขึ้น |
ไม่ควรให้มีข้อมูลที่แสดงสถานะล่าสุดของตาราง Delta เมื่อดําเนินการแปลงรหัสเกิดขึ้น พิจารณาว่าเฟรมมิ่งสามารถช่วยให้คุณให้ผลลัพธ์คิวรีที่สอดคล้องกันในสภาพแวดล้อมที่ข้อมูลในตาราง Delta เป็นแบบชั่วคราว ข้อมูลอาจเป็นไปชั่วคราวด้วยเหตุผลหลายประการ เช่น เมื่อกระบวนการแยก การแปลง และโหลด (ETL) ทํางานเป็นเวลานาน
การรีเฟรชสําหรับแบบจําลองความหมาย Direct Lake สามารถทําได้ด้วยตนเอง โดยอัตโนมัติ หรือด้วยการตั้งโปรแกรม สําหรับข้อมูลเพิ่มเติม ดู รีเฟรชแบบจําลองความหมาย Direct Lake
สําหรับข้อมูลเพิ่มเติมเกี่ยวกับการกําหนดรุ่นและเฟรมตาราง Delta ดู ทําความเข้าใจที่เก็บข้อมูลสําหรับแบบจําลองความหมาย Direct Lake
การอัปเดตอัตโนมัติ
มีการตั้งค่าระดับแบบจําลองเชิงความหมายเพื่ออัปเดตตาราง Direct Lake โดยอัตโนมัติ ซึ่งเปิดใช้งานไว้แล้วตามค่าเริ่มต้น เพื่อให้แน่ใจว่าการเปลี่ยนแปลงข้อมูลใน OneLake จะมีผลโดยอัตโนมัติในแบบจําลองความหมาย Direct Lake คุณควรปิดใช้งานการปรับปรุงอัตโนมัติเมื่อคุณต้องการควบคุมการเปลี่ยนแปลงข้อมูลโดยการเฟรมซึ่งอธิบายไว้ในส่วนก่อนหน้า สําหรับข้อมูลเพิ่มเติม ดู จัดการแบบจําลองความหมาย Direct Lake
เคล็ดลับ
คุณสามารถตั้งค่าการ รีเฟรช หน้าอัตโนมัติในรายงาน Power BI ของคุณได้ ซึ่งเป็นคุณลักษณะที่รีเฟรชหน้ารายงานเฉพาะโดยอัตโนมัติ ซึ่งรายงานจะเชื่อมต่อกับแบบจําลองความหมาย Direct Lake (หรือแบบจําลองความหมายชนิดอื่น ๆ)
แสดงแทน DirectQuery
คิวรีที่ส่งไปยังแบบจําลองความหมาย Direct Lake สามารถกลับไปเป็น โหมด DirectQuery ได้ ในกรณีนี้ จะดึงข้อมูลโดยตรงจากจุดสิ้นสุดการวิเคราะห์ SQL ของเลคเฮ้าส์หรือคลังสินค้า คิวรีดังกล่าวจะส่งกลับข้อมูลล่าสุดเสมอเนื่องจากไม่ได้ถูกจํากัดไว้ที่จุดเวลาของการดําเนินการเฟรมล่าสุด
คิวรีจะถอยกลับเมื่อแบบจําลองความหมายคิวรีมุมมองในจุดสิ้นสุดการวิเคราะห์ SQL หรือตารางในจุดสิ้นสุดการวิเคราะห์ SQL ที่บังคับใช้การรักษาความปลอดภัยระดับแถว (RLS)
นอกจากนี้ คิวรีอาจย้อนกลับเมื่อแบบจําลองความหมายเกิน guardrails ของความจุ
สำคัญ
ถ้าเป็นไปได้ คุณควรออกแบบโซลูชันของคุณเสมอหรือปรับขนาดความจุของคุณ เพื่อหลีกเลี่ยงการย้อนกลับ DirectQuery นั่นเป็นเพราะอาจส่งผลให้ประสิทธิภาพการคิวรีช้าลง
คุณสามารถควบคุมข้อมูลสํารองของแบบจําลองความหมาย Direct Lake ของคุณได้โดยการตั้งค่าคุณสมบัติ DirectLakeBehavior สําหรับข้อมูลเพิ่มเติม ดู ตั้งค่าคุณสมบัติลักษณะการทํางานของ Direct Lake
ตัวป้องกันและขีดจํากัดความจุของผ้า
แบบจําลองความหมาย Direct Lake จําเป็นต้องมี สิทธิ์การใช้งานความจุ Fabric นอกจากนี้ยังมีตัวรักษาความจุและข้อจํากัดที่นําไปใช้กับการสมัครใช้งานความจุ Fabric (SKU) ของคุณ ตามที่แสดงในตารางต่อไปนี้
สำคัญ
คอลัมน์แรกในตารางต่อไปนี้ยังรวมถึงการสมัครใช้งานความจุ Power BI Premium (P SKU) ด้วย โปรดทราบว่า Microsoft กําลังรวมตัวเลือกการซื้อและเลิกใช้ Power BI Premium ต่อความจุ SKU ลูกค้าใหม่และลูกค้าที่มีอยู่ควรพิจารณาซื้อการสมัครใช้งานความจุ Fabric (F SKU) แทน
สําหรับข้อมูลเพิ่มเติม ดูการปรับปรุงที่สําคัญที่มาพร้อมกับสิทธิ์การใช้งาน Power BI Premium และ Power BI Premium
Fabric SKU | ไฟล์ Parquet ต่อตาราง | กลุ่มแถวต่อตาราง | แถวต่อตาราง (ล้าน) | ขนาดแบบจําลองสูงสุดบนดิสก์/OneLake (GB) | หน่วยความจําสูงสุด (GB) 1 |
---|---|---|---|---|---|
F2 | 1,000 | 1,000 | 300 | 10 | 3 |
F4 | 1,000 | 1,000 | 300 | 10 | 3 |
F8 | 1,000 | 1,000 | 300 | 10 | 3 |
F16 | 1,000 | 1,000 | 300 | 20 | 5 |
F32 | 1,000 | 1,000 | 300 | 40 | 10 |
F64/FT1/P1 | 5,000 | 5,000 | 1,500 | ไม่จำกัด | 25 |
F128/P2 | 5,000 | 5,000 | 3,000 | ไม่จำกัด | 50 |
F256/P3 | 5,000 | 5,000 | 6,000 | ไม่จำกัด | 100 |
F512/P4 | 10,000 | 10,000 | 12,000 | ไม่จำกัด | 200 |
F1024/P5 | 10,000 | 10,000 | 24,000 | ไม่จำกัด | 400 |
F2048 | 10,000 | 10,000 | 24,000 | ไม่จำกัด | 400 |
1 สําหรับแบบจําลอง ความหมาย Direct Lake หน่วยความจํา สูงสุดแสดงถึงขีดจํากัดทรัพยากรหน่วยความจําด้านบนสําหรับปริมาณข้อมูลที่สามารถจัดหน้าได้ ด้วยเหตุผลนี้ จึงไม่ใช่ตัวรักษาเนื่องจากเกินจะไม่ส่งผลต่อการย้อนกลับไปยังโหมด DirectQuery อย่างไรก็ตาม อาจมีผลกระทบต่อประสิทธิภาพการทํางานหากจํานวนข้อมูลมีขนาดใหญ่พอที่จะทําให้เกิดการแบ่งหน้าและออกจากข้อมูลแบบจําลองที่มากเกินไปจากข้อมูล OneLake
หากเกิน ขนาดแบบจําลองสูงสุดบน ดิสก์/OneLake จะทําให้คิวรีทั้งหมดไปยังแบบจําลองความหมายจะกลับไปเป็นโหมด DirectQuery ตัวป้องกันอื่นๆ ทั้งหมดที่แสดงในตารางจะได้รับการประเมินต่อคิวรี สิ่งสําคัญคือคุณต้อง ปรับตาราง Delta และ แบบจําลอง ความหมาย Direct Lake ของคุณให้เหมาะสมเพื่อหลีกเลี่ยงการปรับขนาดเป็น Fabric SKU ที่สูงขึ้นโดยไม่จําเป็น (ส่งผลให้ต้นทุนเพิ่มขึ้น)
นอกจากนี้ หน่วยความจุและหน่วยความจําสูงสุดต่อขีดจํากัดคิวรีใช้กับแบบจําลองความหมาย Direct Lake สําหรับข้อมูลเพิ่มเติม ให้ดู ความจุและ SKU
ข้อควรพิจารณาและข้อจำกัด
แบบจําลองความหมายของทะเลสาบโดยตรงนําเสนอข้อควรพิจารณาและข้อจํากัดบางอย่าง
หมายเหตุ
ความสามารถและคุณสมบัติของแบบจําลองความหมาย Direct Lake กําลังพัฒนาขึ้น โปรดอย่าลืมกลับมาตรวจสอบเป็นระยะ ๆ เพื่อตรวจสอบรายการข้อควรพิจารณาและข้อจํากัดล่าสุด
- เมื่อตารางแบบจําลองความหมายของ Direct Lake เชื่อมต่อกับตารางในจุดสิ้นสุดการวิเคราะห์ SQL ที่บังคับใช้การรักษาความปลอดภัยระดับแถว (RLS) คิวรีที่เกี่ยวข้องกับตารางแบบจําลองจะกลับไปเป็นโหมด DirectQuery เสมอ ประสิทธิภาพการทํางานของคิวรีอาจช้าลง
- เมื่อตารางแบบจําลองความหมายของ Direct Lake เชื่อมต่อกับมุมมองในจุดสิ้นสุดการวิเคราะห์ SQL คิวรีที่เกี่ยวข้องกับตารางแบบจําลองนั้นจะกลับไปใช้โหมด DirectQuery เสมอ ประสิทธิภาพการทํางานของคิวรีอาจช้าลง
- ไม่สนับสนุนการสร้างแบบจําลองแบบรวม ซึ่งหมายความว่าตารางแบบจําลองความหมาย Direct Lake ไม่สามารถผสมกับตารางในโหมดที่เก็บข้อมูลอื่น ๆ ได้ เช่น นําเข้า DirectQuery หรือคู่ (ยกเว้นกรณีพิเศษ รวมถึงกลุ่มการคํานวณ พารามิเตอร์ What-if และพารามิเตอร์เขตข้อมูล)
- คอลัมน์จากการคํานวณและตารางจากการคํานวณที่อ้างอิงคอลัมน์หรือตารางในโหมดที่เก็บข้อมูล Direct Lake ไม่ได้รับการสนับสนุน กลุ่มการคํานวณ พารามิเตอร์ What-if และพารามิเตอร์เขตข้อมูล ซึ่งสร้างตารางจากการคํานวณโดยนัยและตารางจากการคํานวณที่ไม่ได้อ้างอิงคอลัมน์ Direct Lake หรือตารางที่ได้รับการสนับสนุน
- ตารางโหมดที่เก็บข้อมูลของ Direct Lake ไม่สนับสนุนชนิดคอลัมน์ของตาราง Delta ที่ซับซ้อน ไบนารีและชนิดความหมาย GUID ยังไม่รองรับเช่นกัน คุณต้องแปลงชนิดข้อมูลเหล่านี้เป็นสตริงหรือชนิดข้อมูลที่ได้รับการสนับสนุนอื่นๆ
- ความสัมพันธ์ของตารางจําเป็นต้องใช้ชนิดข้อมูลของคอลัมน์ที่เกี่ยวข้องเพื่อให้ตรงกัน
- คอลัมน์ด้านเดียวของความสัมพันธ์ต้องมีค่าที่ไม่ซ้ํากัน คิวรีจะล้มเหลวถ้าตรวจพบค่าที่ซ้ํากันในคอลัมน์ด้านเดียว
- ข้อมูลอัตโนมัติ/ตัวแสดงเวลาใน Power BI Desktop ไม่ได้รับการสนับสนุน การทําเครื่องหมายตาราง วันที่ของคุณเองเป็นตารางวันที่ได้รับการสนับสนุน
- ความยาวของค่าคอลัมน์สตริงถูกจํากัดไว้ที่อักขระ Unicode 32,764 ตัว
- ไม่สนับสนุนค่า จุดทศนิยมลอยตัว NaN (ไม่ใช่ตัวเลข)
- การฝังสถานการณ์ที่ใช้ สถานการณ์การใช้งานสําหรับลูกค้า ของคุณไม่ได้รับการสนับสนุน
- เผยแพร่บนเว็บจาก Power BI ได้รับการสนับสนุนเมื่อใช้ ข้อมูลประจําตัวคงที่สําหรับแบบจําลองความหมาย Direct Lake เท่านั้น
- ใน ประสบการณ์การสร้างแบบจําลองเว็บ การตรวจสอบความถูกต้องถูกจํากัดสําหรับแบบจําลองความหมาย Direct Lake การเลือกผู้ใช้จะสันนิษฐานว่าถูกต้อง และจะไม่มีการออกคิวรีเพื่อตรวจสอบคาร์ดินาลลิตี้หรือการเลือกตัวกรองข้ามสําหรับความสัมพันธ์ หรือสําหรับคอลัมน์วันที่ที่เลือกในตารางวันที่ที่ทําเครื่องหมาย
- ในพอร์ทัล Fabric แท็บ Direct Lake ในประวัติการรีเฟรชแสดงรายการความล้มเหลวในการรีเฟรชที่เกี่ยวข้องกับ Direct Lake เท่านั้น การดําเนินการรีเฟรช (เฟรมมิ่ง) ที่สําเร็จจะไม่แสดงอยู่ในรายการ
- Fabric SKU ของคุณจะกําหนดหน่วยความจําที่มีอยู่สูงสุดต่อแบบจําลองความหมาย Direct Lake สําหรับความจุ เมื่อเกินขีดจํากัด คิวรีไปยังแบบจําลองความหมายอาจช้าลงเนื่องจากการแบ่งหน้าเข้าและออกจากข้อมูลแบบจําลองมากเกินไป
- การสร้างแบบจําลองความหมายของ Direct Lake ในพื้นที่ทํางานที่อยู่ในภูมิภาคที่แตกต่างกันของพื้นที่ทํางานแหล่งข้อมูลไม่ได้รับการสนับสนุน ตัวอย่างเช่น ถ้าเลคเฮ้าส์อยู่ในสหรัฐอเมริกาตอนกลางทางตะวันตก คุณสามารถสร้างแบบจําลองเชิงความหมายจากเลคเฮ้าส์นี้ในภูมิภาคเดียวกันเท่านั้น การแก้ไขปัญหาชั่วคราวคือการสร้างเลคเฮ้าส์ในพื้นที่ทํางานของภูมิภาคอื่นและทางลัดไปยังตารางก่อนที่จะสร้างแบบจําลองความหมาย หากต้องการค้นหาภูมิภาคที่คุณอยู่ โปรดดู ที่ภูมิภาค Fabric home ของคุณ
เปรียบเทียบกับโหมดที่เก็บข้อมูลอื่น
ตารางต่อไปนี้เปรียบเทียบโหมดที่เก็บข้อมูล Direct Lake กับโหมดที่เก็บข้อมูลแบบนําเข้าและ DirectQuery
ความสามารถ | Direct Lake | นำเข้า | DirectQuery |
---|---|---|---|
สิทธิ์การใช้งาน | การสมัครสมาชิกความจุของ Fabric (SKU) เท่านั้น | สิทธิ์การใช้งาน Fabric หรือ Power BI ใด ๆ (รวมถึงสิทธิ์การใช้งาน Microsoft Fabric ฟรี) | สิทธิ์การใช้งาน Fabric หรือ Power BI ใด ๆ (รวมถึงสิทธิ์การใช้งาน Microsoft Fabric ฟรี) |
แหล่งข้อมูล | เฉพาะเลคเฮ้าส์หรือตารางคลังสินค้า (หรือมุมมอง) | ตัวเชื่อมต่อใด ๆ | ตัวเชื่อมต่อใด ๆ ที่สนับสนุนโหมด DirectQuery |
เชื่อมต่อกับมุมมองปลายทางการวิเคราะห์ SQL | ใช่ – แต่จะกลับไปใช้โหมด DirectQuery โดยอัตโนมัติ | ใช่ | ใช่ |
โมเดลแบบรวม | ไม่ 1 | ใช่ – สามารถรวมกับตารางโหมดที่เก็บข้อมูล DirectQuery หรือคู่ได้ | ใช่ – สามารถรวมกับตารางโหมดที่เก็บข้อมูลแบบนําเข้าหรือคู่ได้ |
ลงชื่อเข้าระบบครั้งเดียว (SSO) | ใช่ | ใช้ไม่ได้ | ใช่ |
ตารางจากการคำนวณ | No – ยกเว้นกลุ่มการคํานวณ พารามิเตอร์ What-if และพารามิเตอร์เขตข้อมูล ซึ่งสร้างตารางจากการคํานวณโดยนัย | ใช่ | No – ตารางจากการคํานวณใช้โหมดที่เก็บข้อมูลแบบนําเข้าแม้ว่าตารางเหล่านั้นจะอ้างอิงไปยังตารางอื่นในโหมด DirectQuery |
คอลัมน์จากการคำนวณ | ไม่ใช่ | ใช่ | ใช่ |
ตารางแบบไฮบริด | ไม่ใช่ | ใช่ | ใช่ |
พาร์ติชันตารางแบบจําลอง | ไม่ อย่างไรก็ตาม การ แบ่งพาร์ติชันสามารถทําได้ที่ระดับตาราง Delta | ใช่ – สร้างขึ้นโดยอัตโนมัติโดยการรีเฟรชแบบเพิ่มหน่วย หรือ สร้างขึ้น ด้วยตนเองโดยใช้ตําแหน่งข้อมูล XMLA | ไม่ |
การรวมที่ผู้ใช้กําหนดเอง | ไม่ใช่ | ใช่ | ใช่ |
การรักษาความปลอดภัยระดับออบเจ็กต์ปลายทางของการวิเคราะห์ SQL หรือการรักษาความปลอดภัยระดับคอลัมน์ | ใช่ – แต่คิวรีจะกลับไปเป็นโหมด DirectQuery และอาจก่อให้เกิดข้อผิดพลาดเมื่อปฏิเสธสิทธิ์ | ใช่ – แต่ต้องทําซ้ําสิทธิ์ด้วยการรักษาความปลอดภัยระดับออบเจ็กต์แบบจําลองเชิงความหมาย | ใช่ – แต่คิวรีอาจทําให้เกิดข้อผิดพลาดเมื่อปฏิเสธสิทธิ์ |
การรักษาความปลอดภัยระดับแถวปลายทางการวิเคราะห์ SQL (RLS) | ใช่ – แต่คิวรีจะกลับไปเป็นโหมด DirectQuery | ใช่ – แต่ต้องทําซ้ําสิทธิ์ด้วย RLS ของแบบจําลองความหมาย | ใช่ |
การรักษาความปลอดภัยระดับแถวแบบจําลองเชิงความหมาย (RLS) | ใช่ – แต่ขอแนะนําอย่างยิ่ง ให้ใช้การเชื่อมต่อระบบคลาวด์แบบ คงที่ | ใช่ | ใช่ |
การรักษาความปลอดภัยระดับออบเจ็กต์แบบจําลองเชิงความหมาย (OLS) | ใช่ | ใช่ | ใช่ |
ปริมาณข้อมูลขนาดใหญ่โดยไม่มีข้อกําหนดการรีเฟรช | ใช่ | เหมาะสมน้อยกว่า – อาจจําเป็นต้องใช้ขนาดความจุที่ใหญ่กว่าสําหรับการคิวรีและการรีเฟรช | ใช่ |
ลดเวลาแฝงของข้อมูล | ใช่ – เมื่อ เปิดใช้งานการอัปเดต อัตโนมัติหรือการรีเฟรมิ่งทางโปรแกรม อย่างไรก็ตาม การเตรียม ข้อมูลจะต้องทําอัพสตรีมก่อน | ไม่ใช่ | ใช่ |
1 คุณไม่สามารถรวมตารางโหมดที่เก็บข้อมูล Direct Lake กับตาราง โหมดที่เก็บข้อมูล DirectQuery หรือคู่ในแบบจําลองความหมายเดียวกัน อย่างไรก็ตาม คุณสามารถใช้ Power BI Desktop เพื่อสร้างแบบจําลองแบบรวมบนแบบจําลองความหมาย Direct Lake และขยายด้วยตารางใหม่ (โดยใช้โหมดที่เก็บข้อมูลแบบนําเข้า DirectQuery หรือโหมดที่เก็บข้อมูลแบบคู่) หรือการคํานวณได้ สําหรับข้อมูลเพิ่มเติม ดู สร้างแบบจําลองแบบรวมบนแบบจําลองความหมาย