การทํางานร่วมกันในรูปแบบตาราง Delta Lake
ใน Microsoft Fabric รูปแบบตาราง Delta Lake เป็นมาตรฐานสําหรับการวิเคราะห์ Delta Lake เป็นเลเยอร์ที่เก็บข้อมูลแบบโอเพนซอร์สที่นํา ACID (อะตอม ความสม่ําเสมอ การแยก การแยก ความทนทาน) กับปริมาณงานข้อมูลขนาดใหญ่และการวิเคราะห์
ประสบการณ์การใช้งาน Fabric ทั้งหมดสร้างและใช้ตาราง Delta Lake ขับเคลื่อนการทํางานร่วมกันและประสบการณ์ผลิตภัณฑ์แบบรวม ตาราง Delta Lake ที่ผลิตโดยกลไกการคํานวณหนึ่งเช่น Synapse Data Warehouse หรือ Synapse Spark สามารถใช้ได้โดยกลไกอื่น ๆ เช่น Power BI เมื่อคุณนําเข้าข้อมูลลงใน Fabric Fabric จะจัดเก็บเป็นตาราง Delta ตามค่าเริ่มต้น คุณสามารถรวมข้อมูลภายนอกที่มีตาราง Delta Lake ได้อย่างง่ายดายโดยใช้ทางลัด OneLake
คุณลักษณะเดลต้าเลคและประสบการณ์การใช้งาน Fabric
เพื่อให้สามารถทํางานร่วมกันได้ ประสบการณ์ Fabric ทั้งหมดจึงสอดคล้องกับคุณลักษณะ Delta Lake และความสามารถของ Fabric ประสบการณ์บางอย่างสามารถเขียนไปยังตาราง Delta Lake เท่านั้นในขณะที่ประสบการณ์อื่น สามารถอ่านจากตารางดังกล่าวได้
- ผู้เขียน: คลังข้อมูล กระแสข้อมูล และส่งออกแบบจําลองความหมาย Power BI ไปยัง OneLake
- ผู้อ่าน: จุดสิ้นสุดการวิเคราะห์ SQL และแบบจําลองความหมายของทะเลสาบโดยตรงของ Power BI
- ผู้เขียนและผู้อ่าน: รันไทม์ Fabric Spark กระแสข้อมูล ไปป์ไลน์ข้อมูล และฐานข้อมูล Kusto Query Language (KQL)
เมทริกซ์ต่อไปนี้แสดงคุณลักษณะ Delta Lake ที่สําคัญและการสนับสนุนของพวกเขาในแต่ละความสามารถของ Fabric
ความสามารถของผ้า | การแมปคอลัมน์ตามชื่อ | เวกเตอร์การลบ | การเขียนตามลําดับ V | การปรับตารางให้เหมาะสมและการบํารุงรักษา | เขียนพาร์ติชัน | อ่านพาร์ติชัน | การคลัสเตอร์ของเหลว | TIMESTAMP_NTZ | เวอร์ชัน Delta reader/writer และคุณลักษณะตารางเริ่มต้น |
---|---|---|---|---|---|---|---|---|---|
คลังข้อมูลส่งออก Delta Lake | ไม่ใช่ | ใช่ | ใช่ | ใช่ | ไม่ | ใช่ | ไม่ | ไม่ | ผู้อ่าน: 3 ผู้เขียน: 7 เวกเตอร์การลบ |
จุดสิ้นสุดการวิเคราะห์ SQL | ใช่ | ใช่ | N/A (ไม่สามารถใช้ได้) | N/A (ไม่สามารถใช้ได้) | N/A (ไม่สามารถใช้ได้) | ใช่ | ใช่ | ไม่ใช่ | N/A (ไม่สามารถใช้ได้) |
Fabric Spark Runtime 1.3 | ใช่ | ใช่ | ใช่ | ใช่ | ใช่ | ใช่ | ใช่ | ใช่ | ผู้อ่าน: 1 ผู้เขียน: 2 |
Fabric Spark Runtime 1.2 | ใช่ | ใช่ | ใช่ | ใช่ | ใช่ | ใช่ | ใช่ อ่านอย่างเดียว | ใช่ | ผู้อ่าน: 1 ผู้เขียน: 2 |
Fabric Spark Runtime 1.1 | ตกลง | ไม่ | ใช่ | ใช่ | ใช่ | ใช่ | ใช่ อ่านอย่างเดียว | ไม่ | ผู้อ่าน: 1 ผู้เขียน: 2 |
กระแสข้อมูล | ใช่ | ใช่ | ใช่ | ไม่ | ใช่ | ใช่ | ใช่ อ่านอย่างเดียว | ไม่ | ผู้อ่าน: 1 ผู้เขียน: 2 |
ไปป์ไลน์ข้อมูล | ไม่ใช่ | ไม่ | ใช่ | ไม่ใช่ | ใช่ เขียนทับเท่านั้น | ใช่ | ใช่ อ่านอย่างเดียว | ไม่ | ผู้อ่าน: 1 ผู้เขียน: 2 |
แบบจําลองความหมายทะเลสาบโดยตรงของ Power BI | ใช่ | ใช่ | N/A (ไม่สามารถใช้ได้) | N/A (ไม่สามารถใช้ได้) | N/A (ไม่สามารถใช้ได้) | ใช่ | ใช่ | ไม่ใช่ | N/A (ไม่สามารถใช้ได้) |
ส่งออกแบบจําลองความหมาย Power BI ไปยัง OneLake | ใช่ | N/A (ไม่สามารถใช้ได้) | ตกลง | ไม่ | ใช่ | N/A (ไม่สามารถใช้ได้) | ไม่ใช่ | ไม่ | ผู้อ่าน: 2 ผู้เขียน: 5 |
ฐานข้อมูล KQL | ใช่ | ใช่ | ไม่ | ไม่ใช่* | ใช่ | ใช่ | ไม่ | ไม่ | ผู้อ่าน: 1 ผู้เขียน: 1 |
เหตุการณ์สตรีม | ไม่ใช่ | ไม่ | ไม่ | ไม่ | ใช่ | N/A (ไม่สามารถใช้ได้) | ไม่ใช่ | ไม่ | ผู้อ่าน: 1 ผู้เขียน: 2 |
*ฐานข้อมูล KQL มีความสามารถบํารุงรักษาตารางบางอย่างเช่นการเก็บรักษา ข้อมูลจะถูกลบออกเมื่อสิ้นสุดระยะเวลาการเก็บรักษาจาก OneLake สําหรับข้อมูลเพิ่มเติม ให้ดู หนึ่งสําเนาแบบลอจิคัล
หมายเหตุ
- Fabric ไม่เขียนการแมปคอลัมน์ตามชื่อตามค่าเริ่มต้น ประสบการณ์ Fabric เริ่มต้นจะสร้างตารางที่เข้ากันได้ทั่วทั้งบริการ Delta lake ซึ่งผลิตโดยบริการจากบุคคลที่สามอาจมีคุณลักษณะตารางที่เข้ากันไม่ได้
- ประสบการณ์การใช้งานผ้าบางอย่างไม่ได้รับการปรับให้เหมาะสมและความสามารถด้านการบํารุงรักษาของตารางที่สืบทอดกันมา เช่น bin-compaction, V-order และล้างไฟล์เก่าที่ไม่ถูกเฟรนด์ เพื่อให้ตาราง Delta Lake เหมาะสมที่สุดสําหรับการวิเคราะห์ ให้ทําตามเทคนิคในการใช้ คุณลักษณะการบํารุงรักษาตารางเพื่อจัดการตาราง delta ใน Fabric สําหรับตารางที่ส่งการนําเข้าโดยใช้ประสบการณ์เหล่านั้น
ข้อจำกัดปัจจุบัน
ในขณะนี้ Fabric ไม่รองรับคุณลักษณะ Delta Lake เหล่านี้:
- เดลต้า เลค 3.x Uniform
- การเขียนคอลัมน์ข้อมูลประจําตัว (คุณลักษณะ Databricks ที่เป็นกรรมสิทธิ์)
- ตารางเดลต้าไลฟ์ (คุณลักษณะ Databricks ที่เป็นกรรมสิทธิ์)
- RLE (เปิดใช้งานการเข้ารหัสความยาว) บนไฟล์จุดตรวจสอบ
เนื้อหาที่เกี่ยวข้อง
- เดลต้าเลคคืออะไร
- เรียนรู้เพิ่มเติมเกี่ยวกับ ตาราง Delta Lake ใน Fabric Lakehouse และ Synapse Spark
- เรียนรู้เกี่ยวกับ Direct Lake ใน Power BI และ Microsoft Fabric
- เรียนรู้เพิ่มเติมเกี่ยวกับ การคิวรีตารางจาก Warehouse ผ่าน Delta Lake Logs ที่เผยแพร่แล้ว