แชร์ผ่าน


คู่มือการตัดสินใจของ Microsoft Fabric: เลือกที่เก็บข้อมูล

ใช้คู่มืออ้างอิงนี้และสถานการณ์ตัวอย่างเพื่อช่วยให้คุณเลือกที่เก็บข้อมูลสําหรับปริมาณงาน Microsoft Fabric ของคุณ

คุณสมบัติของที่เก็บข้อมูล

ตารางนี้เปรียบเทียบกับที่เก็บข้อมูล เช่น คลังสินค้า lakehouse Datamart Power BI และ eventhouse ตามปริมาณข้อมูล ประเภท บุคลิกของนักพัฒนา ชุดทักษะ การดําเนินงาน และความสามารถอื่น ๆ

คลังสินค้า เลคเฮ้าส์ Power BI Datamart อีเวนต์เฮ้าส์
ปริมาณข้อมูล ไม่จำกัด ไม่จำกัด สูงสุด 100 GB ไม่จำกัด
ชนิดของข้อมูล แบบโครงสร้าง ไม่มีโครงสร้าง กึ่งมีโครงสร้าง มีโครงสร้าง แบบโครงสร้าง ไม่มีโครงสร้าง กึ่งมีโครงสร้าง มีโครงสร้าง
บุคลลสําหรับนักพัฒนาหลัก นักพัฒนาคลังข้อมูล, วิศวกร SQL วิศวกรข้อมูล นักวิทยาศาสตร์ข้อมูล นักพัฒนาพลเมือง นักวิทยาศาสตร์ข้อมูลพลเมือง วิศวกรข้อมูล นักวิทยาศาสตร์ข้อมูล วิศวกร SQL
ชุดทักษะนักพัฒนาหลัก SQL Spark(Scala, PySpark, Spark SQL, R) ไม่มีรหัส SQL ไม่มีรหัส KQL SQL
ข้อมูลที่ถูกจัดระเบียบโดย ฐานข้อมูล สคีมา และตาราง โฟลเดอร์และไฟล์ ฐานข้อมูล และตาราง ฐานข้อมูล ตาราง คิวรี ฐานข้อมูล สคีมา และตาราง
อ่านการดําเนินการ T-SQL, Spark (รองรับการอ่านจากตารางโดยใช้ทางลัด ยังไม่สนับสนุนการเข้าถึงมุมมอง กระบวนงานที่เก็บไว้ ฟังก์ชัน ฯลฯ) Spark, T-SQL Spark, T-SQL, Power BI KQL, T-SQL, Spark, Power BI
การดําเนินการเขียน T-SQL Spark(Scala, PySpark, Spark SQL, R) กระแสข้อมูล, T-SQL KQL, Spark, ระบบนิเวศของตัวเชื่อมต่อ
ธุรกรรมแบบหลายตาราง ตกลง ไม่ ไม่ ใช่ สําหรับการนําเข้าหลายตาราง ดู นโยบายการอัปเดต
อินเทอร์เฟซการพัฒนาหลัก สคริปต์ SQL สมุดบันทึก Spark,ข้อกําหนดงาน Spark Power BI คิวรี KQL, ฐานข้อมูล KQL
ความปลอดภัย ระดับวัตถุ (ตาราง มุมมอง ฟังก์ชัน ขั้นตอนการจัดเก็บ ฯลฯ) ระดับคอลัมน์ ระดับแถว DDL/DML การปกปิดข้อมูลแบบไดนามิก ระดับแถว ระดับคอลัมน์ (สําหรับ lakehouse ที่เข้าถึงผ่านจุดสิ้นสุดการวิเคราะห์ SQL) ระดับตาราง (เมื่อใช้ T-SQL) ไม่มีสําหรับ Spark ตัวแก้ไข RLS ในตัว การรักษาความปลอดภัยระดับแถว
เข้าถึงข้อมูลผ่านปุ่มลัด ใช่ ผ่านเลคเฮ้าส์โดยใช้ชื่อสามส่วน ตกลง ไม่ ใช่
สามารถเป็นแหล่งข้อมูลสําหรับทางลัด ใช่ (ตาราง) ใช่ (ไฟล์และตาราง) ไม่ใช่ ใช่
คิวรีข้ามรายการ ใช่ คิวรีข้ามเลคเฮ้าส์และตารางคลังสินค้า ใช่ คิวรีข้ามเลคเฮ้าส์และตารางคลังสินค้า คิวรีข้ามเลคเฮ้าส์ (รวมถึงทางลัดโดยใช้ Spark) ไม่ ใช่ คิวรีข้ามฐานข้อมูล KQL เลคเฮ้าส์ และโกดังที่มีทางลัด

สถานการณ์สมมติ

ตรวจสอบสถานการณ์เหล่านี้สําหรับความช่วยเหลือเกี่ยวกับการเลือกที่เก็บข้อมูลใน Fabric

สถานการณ์สมมติ 1

Susan นักพัฒนามืออาชีพ เป็นนักพัฒนาใหม่สําหรับ Microsoft Fabric พวกเขาพร้อมที่จะเริ่มต้นการทําความสะอาด การวางรูปแบบ และการวิเคราะห์ข้อมูล แต่จําเป็นต้องตัดสินใจสร้างคลังข้อมูลหรือเลคเฮ้าส์ หลังจากการตรวจทานรายละเอียดในตารางก่อนหน้านี้แล้ว จุดสําหรับการตัดสินใจหลักคือชุดทักษะที่พร้อมใช้งานและความจําเป็นสําหรับธุรกรรมแบบหลายตาราง

Susan ได้ใช้เวลาหลายปีในการสร้างคลังข้อมูลในเครื่องมือฐานข้อมูลเชิงสัมพันธ์ และมีความคุ้นเคยกับไวยากรณ์และฟังก์ชันการทํางานของ SQL เมื่อคิดเกี่ยวกับทีมขนาดใหญ่ ผู้บริโภคหลักของข้อมูลนี้ยังมีทักษะด้วยเครื่องมือวิเคราะห์ SQL และ SQL Susan ตัดสินใจที่จะใช้ คลังข้อมูล ซึ่งช่วยให้ทีมสามารถโต้ตอบกับ T-SQL เป็นหลัก ในขณะที่ยังอนุญาตให้ผู้ใช้ Spark ใด ๆ ในองค์กรสามารถเข้าถึงข้อมูลได้

ซูซานสร้างเลคเฮ้าส์ใหม่และเข้าถึงความสามารถของคลังข้อมูลด้วยจุดสิ้นสุดการวิเคราะห์ของเลคเฮ้าส์ SQL ใช้พอร์ทัล Fabric สร้างทางลัดไปยังตารางข้อมูลภายนอกและวางไว้ใน /Tables โฟลเดอร์ ตอนนี้ Susan สามารถเขียนคิวรี T-SQL ที่อ้างอิงทางลัดไปยังคิวรีข้อมูล Delta Lake ในเลคเฮาส์ได้แล้ว ทางลัดจะปรากฏเป็นตารางในจุดสิ้นสุดการวิเคราะห์ SQL โดยอัตโนมัติและสามารถคิวรีกับ T-SQL โดยใช้ชื่อสามส่วน

สถานการณ์สมมติ 2

Rob วิศวกรข้อมูลจําเป็นต้องจัดเก็บและจําลองข้อมูลหลายเทราไบต์ใน Fabric ทีมมีการผสมผสานระหว่างทักษะ PySpark และ T-SQL ทีมส่วนใหญ่ที่ใช้คิวรี T-SQL เป็นผู้บริโภค ดังนั้นจึงไม่จําเป็นต้องเขียนคําสั่ง INSERT, UPDATE หรือ DELETE นักพัฒนาที่เหลือจะสะดวกในการทํางานในสมุดบันทึก และเนื่องจากข้อมูลถูกเก็บไว้ใน Delta พวกเขาสามารถโต้ตอบกับไวยากรณ์ SQL ที่คล้ายกัน

Rob ตัดสินใจที่จะใช้ เลคเฮ้าส์ ซึ่งช่วยให้ทีมวิศวกรรมข้อมูลสามารถใช้ทักษะที่หลากหลายของพวกเขากับข้อมูล ในขณะที่ยังอนุญาตให้สมาชิกทีมที่มีทักษะสูงใน T-SQL สามารถใช้ข้อมูลได้

สถานการณ์สมมติ 3

Ash นักพัฒนาพลเมืองเป็นนักพัฒนา Power BI แผนภูมิเหล่านี้จะคุ้นเคยกับ Excel, Power BI และ Office พวกเขาจําเป็นต้องสร้างผลิตภัณฑ์ข้อมูลสําหรับหน่วยธุรกิจ พวกเขารู้ว่าพวกเขาไม่มีทักษะในการสร้างคลังข้อมูลหรือเลคเฮ้าส์และดูเหมือนว่ามากเกินไปสําหรับความต้องการและปริมาณข้อมูลของพวกเขา พวกเขาตรวจสอบรายละเอียดในตารางก่อนหน้าและดูว่าจุดการตัดสินใจหลักเป็นทักษะของตนเองและความจําเป็นสําหรับการบริการตนเองไม่มีความสามารถของโค้ดและปริมาณข้อมูลต่ํากว่า 100 GB

Ash ทํางานร่วมกับนักวิเคราะห์ธุรกิจที่คุ้นเคยกับ Power BI และ Microsoft Office และรู้ว่าพวกเขามีการสมัครใช้งานความจุพรีเมียมอยู่แล้ว เมื่อพวกเขาคิดถึงทีมขนาดใหญ่พวกเขาตระหนักถึงผู้บริโภคหลักของข้อมูลนี้อาจเป็นนักวิเคราะห์คุ้นเคยกับเครื่องมือวิเคราะห์ที่ไม่มีรหัสและ SQL แอชตัดสินใจที่จะใช้ Datamart ของ Power BI ซึ่งช่วยให้ทีมสามารถโต้ตอบสร้างความสามารถได้อย่างรวดเร็วโดยใช้ประสบการณ์ที่ไม่มีรหัส คิวรีสามารถดําเนินการผ่าน Power BI และ T-SQL ในขณะที่ยังอนุญาตให้ผู้ใช้ Spark ใด ๆ ในองค์กรสามารถเข้าถึงข้อมูลได้เช่นกัน

สถานการณ์จำลอง 4

Daisy เป็นนักวิเคราะห์ธุรกิจที่มีประสบการณ์ในการใช้ Power BI ในการวิเคราะห์ปัญหาคอขวดของห่วงโซ่อุปทานสําหรับห่วงโซ่การค้าปลีกขนาดใหญ่ทั่วโลก พวกเขาจําเป็นต้องสร้างโซลูชันข้อมูลที่ปรับขนาดได้ ซึ่งสามารถจัดการแถวข้อมูลหลายพันล้านแถว และสามารถใช้เพื่อสร้างแดชบอร์ดและรายงานที่สามารถใช้เพื่อทําการตัดสินใจทางธุรกิจ ข้อมูลมาจากโรงงาน ซัพพลายเออร์ ผู้ขนส่ง และแหล่งข้อมูลอื่น ๆ ในรูปแบบที่มีโครงสร้าง กึ่งมีโครงสร้าง และไม่มีโครงสร้าง

Daisy ตัดสินใจที่จะใช้ eventhouse เนื่องจากความสามารถในการปรับขนาด เวลาตอบสนองที่รวดเร็ว ความสามารถในการวิเคราะห์ขั้นสูงรวมถึงการวิเคราะห์อนุกรมเวลา ฟังก์ชันเชิงพื้นที่ และโหมดคิวรีโดยตรงอย่างรวดเร็วใน Power BI คิวรีสามารถดําเนินการได้โดยใช้ Power BI และ KQL เพื่อเปรียบเทียบระหว่างช่วงเวลาปัจจุบันและก่อนหน้านี้ ระบุปัญหาที่เกิดขึ้นใหม่อย่างรวดเร็ว หรือให้การวิเคราะห์ทางภูมิศาสตร์ของเส้นทางที่ดินและทางทะเล