การสร้างแบบจําลองมิติใน Microsoft Fabric Warehouse
นําไปใช้กับ:✅ จุดสิ้นสุดการวิเคราะห์ SQL และ Warehouse ใน Microsoft Fabric
บทความนี้เป็นครั้งแรกในชุดเกี่ยวกับการสร้างแบบจําลองมิติภายในคลังสินค้า ซึ่งมีคําแนะนําในทางปฏิบัติสําหรับ Warehouse ใน Microsoft Fabric ซึ่งเป็นประสบการณ์ที่สนับสนุนความสามารถ T-SQL จํานวนมาก เช่น การสร้างตารางและการจัดการข้อมูลในตาราง ดังนั้น คุณจึงสามารถควบคุมการสร้างตารางแบบจําลองมิติของคุณและโหลดข้อมูลได้อย่างสมบูรณ์
หมายเหตุ
ในบทความนี้ คําว่า คลัง ข้อมูลหมายถึงคลังข้อมูลองค์กร ซึ่งนําเสนอการรวมที่ครอบคลุมของข้อมูลที่สําคัญทั่วทั้งองค์กร ในทางตรงกันข้าม คําว่าคลังสินค้าแบบสแตนด์อโลนหมายถึง Fabric Warehouse ซึ่งเป็นซอฟต์แวร์ที่เป็นบริการฐานข้อมูลเชิงสัมพันธ์ (SaaS) ที่คุณสามารถใช้เพื่อใช้คลังข้อมูลได้ เพื่อความชัดเจน ในบทความนี้จะมีการกล่าวถึงอย่างหลังเป็น Fabric Warehouse
เคล็ดลับ
หากคุณไม่ได้มีประสบการณ์ด้านการสร้างแบบจําลองมิติ ให้พิจารณาว่าชุดบทความนี้เป็นขั้นตอนแรกของคุณ ซึ่งไม่ได้มีไว้เพื่อการสนทนาที่สมบูรณ์เกี่ยวกับการออกแบบแบบจําลองเชิงมิติ สําหรับข้อมูลเพิ่มเติม ให้ดูที่เนื้อหาที่เผยแพร่ที่ปรับใช้อย่างกว้างขวางโดยตรง เช่น ชุดเครื่องมือคลังข้อมูล: คําแนะนําในการสร้างแบบจําลอง เชิงมิติฉบับสมบูรณ์ (รุ่นที่ 3, 2013) โดย Ralph Kimball และอื่น ๆ
การออกแบบ Schema รูปดาว
แบบจําลองมิติ ที่มีลักษณะเป็นเทคนิคการออกแบบแบบจําลองมิติที่นํามาใช้โดยคลังข้อมูลเชิงสัมพันธ์ ซึ่งเป็นวิธีการออกแบบที่แนะนําเมื่อสร้าง Fabric Warehouse สคีมาแบบดาวประกอบด้วย ตาราง ข้อเท็จจริงและ ตารางมิติ
- ตาราง มิติอธิบายเอนทิตี้ที่เกี่ยวข้องกับองค์กรของคุณและข้อกําหนดการวิเคราะห์ ซึ่งจะแสดงสิ่งที่คุณสร้างแบบจําลองอย่างกว้างๆ สิ่งต่าง ๆ อาจเป็นผลิตภัณฑ์ ผู้คน สถานที่ หรือแนวคิดอื่น ๆ รวมถึงวันที่และเวลา สําหรับข้อมูลเพิ่มเติมและแนวทางปฏิบัติที่ดีที่สุดในการออกแบบ โปรดดู ตาราง มิติในชุดข้อมูลนี้
- ตาราง ข้อเท็จจริงจะจัดเก็บการวัดที่เกี่ยวข้องกับการสังเกตการณ์หรือเหตุการณ์ พวกเขาสามารถจัดเก็บคําสั่งขายยอดคงเหลือสต็อกอัตราแลกเปลี่ยนการอ่านอุณหภูมิและอื่น ๆ ได้ ตารางข้อเท็จจริงประกอบด้วยคีย์มิติร่วมกับค่าที่ละเอียดที่สามารถรวมได้ สําหรับข้อมูลเพิ่มเติมและแนวทางปฏิบัติที่ดีที่สุดสําหรับการออกแบบ ให้ดู ตาราง ข้อเท็จจริง ในชุดข้อมูลนี้
การออกแบบ Schema รูปดาวได้รับการปรับให้เหมาะสมสําหรับปริมาณงานคิวรีการวิเคราะห์ ด้วยเหตุนี้ จึงถือว่าเป็นข้อกําหนดเบื้องต้นสําหรับแบบจําลองความหมาย Power BI ขององค์กร คิวรีการวิเคราะห์เกี่ยวข้องกับการกรอง การจัดกลุ่ม การเรียงลําดับ และสรุปข้อมูล ข้อมูลข้อเท็จจริงได้รับการสรุปภายในบริบทของตัวกรองและการจัดกลุ่มของตารางมิติที่เกี่ยวข้อง
เหตุผลที่เรียกว่า Schema รูปดาวเป็นเพราะตารางข้อเท็จจริงจะสร้างศูนย์กลางของดาวในขณะที่ตารางมิติที่เกี่ยวข้องก่อตัวเป็นจุดของดาว
สคีมาแบบดาวมักจะประกอบด้วยตารางข้อเท็จจริงหลายตาราง ดังนั้นดาวหลายดวง
สคีมาแบบดาวที่ได้รับการออกแบบมาอย่างดีจะส่งมอบคิวรีที่มีประสิทธิภาพสูง (เชิงสัมพันธ์) เนื่องจากมีการรวมตารางน้อยลงและโอกาสที่ดัชนีที่มีประโยชน์จะสูงขึ้น นอกจากนี้ Schema รูปดาวมักต้องมีการบํารุงรักษาต่ําเนื่องจากการออกแบบคลังข้อมูลได้รับการพัฒนา ตัวอย่างเช่น การเพิ่มคอลัมน์ใหม่ไปยังตารางมิติเพื่อสนับสนุนการวิเคราะห์โดยแอตทริบิวต์ใหม่เป็นงานที่ค่อนข้างง่ายในการดําเนินการ ในขณะที่เพิ่มข้อเท็จจริงและมิติใหม่ ๆ เมื่อขอบเขตของคลังข้อมูลพัฒนาขึ้น
อาจเป็นรายวัน ตารางในแบบจําลองมิติจะได้รับการอัปเดตและโหลดโดยกระบวนการแยก แปลง และโหลด (ETL) กระบวนการนี้จะซิงโครไนซ์ข้อมูลกับระบบแหล่งข้อมูลซึ่งจัดเก็บข้อมูลการดําเนินงาน สําหรับข้อมูลเพิ่มเติม ให้ดู โหลดตาราง ในชุดข้อมูลนี้
การสร้างแบบจําลองมิติสําหรับ Power BI
สําหรับโซลูชันระดับองค์กร แบบจําลองมิติใน Fabric Warehouse เป็นข้อกําหนดเบื้องต้นที่แนะนําสําหรับการสร้างแบบจําลองความหมายของ Power BI ไม่เพียงแต่แบบจําลองมิติเท่านั้นที่สนับสนุนแบบจําลองความหมาย แต่ยังเป็นแหล่งข้อมูลสําหรับประสบการณ์การใช้งานอื่น ๆ เช่น แบบจําลองการเรียนรู้ของเครื่อง
อย่างไรก็ตามในบางสถานการณ์อาจไม่ใช่วิธีที่ดีที่สุด ตัวอย่างเช่น นักวิเคราะห์แบบบริการตนเองที่ต้องการอิสระและความคล่องตัวในการดําเนินการอย่างรวดเร็วและไม่จําเป็นต้องพึ่งพา IT อาจสร้างแบบจําลองความหมายที่เชื่อมต่อโดยตรงกับข้อมูลต้นทาง ในกรณีดังกล่าว ทฤษฎีการสร้างแบบจําลองมิติยังคงมีความเกี่ยวข้อง ทฤษฎีนั้นช่วยให้นักวิเคราะห์สร้างแบบจําลองที่ใช้งานง่ายและมีประสิทธิภาพในขณะที่หลีกเลี่ยงความจําเป็นในการสร้างและโหลดแบบจําลองมิติในคลังข้อมูล แต่คุณสามารถสร้างแบบจําลองมิติแบบ quasi ได้โดยใช้ Power Query ซึ่งกําหนดตรรกะเพื่อเชื่อมต่อและแปลงข้อมูลต้นทางเพื่อสร้างและโหลดตารางแบบจําลองความหมาย สําหรับข้อมูลเพิ่มเติม โปรดดูทําความเข้าใจ Schema รูปดาวและความสําคัญของ Power BI
สำคัญ
เมื่อคุณใช้ Power Query เพื่อกําหนดแบบจําลองมิติในแบบจําลองความหมาย คุณจะไม่สามารถ จัดการการเปลี่ยนแปลงในอดีตได้ ซึ่งอาจจําเป็นในการวิเคราะห์อดีตให้ถูกต้อง หากเป็นข้อกําหนด คุณควรสร้างคลังข้อมูลและอนุญาตให้กระบวนการ ETL เป็นระยะๆ เพื่อจับภาพและจัดเก็บการเปลี่ยนแปลงมิติอย่างเหมาะสม
การวางแผนสําหรับคลังข้อมูล
คุณควรเข้าถึงการสร้างคลังข้อมูลและการออกแบบแบบจําลองมิติเป็นการดําเนินการที่ร้ายแรงและสําคัญ นั่นเป็นเพราะคลังข้อมูลเป็นส่วนประกอบหลักของแพลตฟอร์มข้อมูลของคุณ ซึ่งควรสร้างรากฐานที่แข็งแกร่งที่สนับสนุนการวิเคราะห์และการรายงาน และดังนั้นจึงเป็นการตัดสินใจสําหรับทั้งองค์กรของคุณ
ในตอนท้ายนี้ คลังข้อมูลของคุณควรพยายามจัดเก็บคุณภาพ สอดคล้อง และมีความแม่นยําในอดีตในฐานะ เวอร์ชันของความจริงเพียงเวอร์ชันเดียว ซึ่งควรส่งมอบข้อมูลที่เข้าใจได้และนําทางได้พร้อมประสิทธิภาพการทํางานที่รวดเร็ว และบังคับใช้สิทธิ์เพื่อให้บุคคลที่เหมาะสมสามารถเข้าถึงข้อมูลที่ถูกต้องเท่านั้น พยายามออกแบบคลังข้อมูลของคุณเพื่อความยืดหยุ่น เพื่อให้สามารถปรับให้เข้ากับการเปลี่ยนแปลงได้ตามความต้องการของคุณที่พัฒนาขึ้น
การใช้งานคลังข้อมูลที่ประสบความสําเร็จนั้นขึ้นอยู่กับการวางแผนที่ดี สําหรับข้อมูลเกี่ยวกับข้อควรพิจารณาเชิงกลยุทธ์และยุทธวิธี และรายการการดําเนินการที่นําไปสู่การปรับใช้ Fabric และคลังข้อมูลของคุณที่ประสบความสําเร็จ โปรดดู แผนงานการปรับใช้ Microsoft Fabric
เคล็ดลับ
เราขอแนะนําให้คุณสร้างคลังข้อมูลองค์กรของคุณแบบซ้ํา ๆ เริ่มต้นด้วยขอบเขตเนื้อหาที่สําคัญที่สุดก่อน จากนั้นเมื่อเวลาผ่านไปตามลําดับความสําคัญและทรัพยากร ขยายคลังข้อมูลด้วยพื้นที่ชื่อเรื่องอื่น ๆ
เนื้อหาที่เกี่ยวข้อง
ในบทความถัดไปในชุดนี้ คุณจะได้เรียนรู้เกี่ยวกับคําแนะนําและแนวทางปฏิบัติที่ดีที่สุดสําหรับการออกแบบสําหรับ ตารางมิติ