บทนำ
การสร้างแบบจําลองเชิงความหมายที่ยอดเยี่ยมเป็นหนึ่งในงานที่สําคัญที่สุดที่นักวิเคราะห์ข้อมูลสามารถดําเนินการได้ใน Microsoft Power BI ด้วยการทำงานนี้ให้ดี จะช่วยให้ผู้คนเข้าใจข้อมูลของคุณได้ง่ายขึ้น ซึ่งจะทำให้การสร้างรายงาน Power BI ที่มีประโยชน์สำหรับพวกเขาและคุณง่ายขึ้น
หน้าในโมดูลนี้เป็นการเรียนการสอนเท่านั้นไม่มีไฟล์ข้อมูลให้ คุณมีโอกาสทํางานกับข้อมูลจริงในแล็บ
แบบจําลองความหมายที่ดีมีประโยชน์ดังต่อไปนี้:
การสำรวจข้อมูลเร็วขึ้น
การรวมนั้นง่ายกว่าในแง่การสร้าง
รายงานมีความแม่นยำมากขึ้น
การเขียนรายงานใช้เวลาน้อยลง
รายงานจะง่ายต่อการบำรุงรักษาในอนาคต
การกําหนดกฎเกณฑ์ว่าสิ่งใดทําให้แบบจําลองความหมายที่ดีนั้นเป็นเรื่องยากเพราะข้อมูลทั้งหมดนั้นแตกต่างกันและการใช้ข้อมูลนั้นแตกต่างกันไป โดยทั่วไปแล้ว แบบจําลองความหมายที่มีขนาดเล็กกว่าจะดีกว่าเนื่องจากทํางานได้เร็วกว่าและจะใช้งานได้ง่ายกว่า อย่างไรก็ตาม การกําหนดสิ่งที่แนบมาของแบบจําลองความหมายที่มีขนาดเล็กนั้นเป็นปัญหาเท่ากันเพราะมันเป็นฮิวริสติกและฮิวริสติก
โดยทั่วไปแล้ว แบบจําลองความหมายที่มีขนาดเล็กกว่าจะประกอบด้วยตารางที่น้อยลงและคอลัมน์ที่น้อยลงในแต่ละตารางที่ผู้ใช้สามารถดูได้ ถ้าคุณนำเข้าตารางที่จำเป็นทั้งหมดจากฐานข้อมูลยอดขาย แต่จำนวนตารางทั้งหมดคือ 30 ตาราง จะทำให้ผู้ใช้รู้สึกว่าใช้งานยาก การยุบตารางเหล่านั้นออกเป็นห้าตารางทําให้แบบจําลองความหมายใช้งานง่ายขึ้นสําหรับผู้ใช้ ในขณะที่ถ้าผู้ใช้เปิดตารางและพบคอลัมน์ 100 คอลัมน์ พวกเขาอาจพบว่ามีตารางล้นหลามเกินไป การลบคอลัมน์ที่ไม่จําเป็นออกเพื่อให้มีจํานวนที่สามารถจัดการได้มากขึ้นจะเพิ่มความเป็นไปได้ที่ผู้ใช้จะอ่านชื่อคอลัมน์ทั้งหมด โดยสรุป คุณควรมีจุดมุ่งหมายเพื่อความเรียบง่ายเมื่อออกแบบแบบจําลองความหมายของคุณ
รูปภาพต่อไปนี้เป็นแบบจําลองความหมายตัวอย่าง กล่องประกอบด้วยตารางข้อมูลโดยที่รายการของเส้นแต่ละรายการภายในกล่องเป็นคอลัมน์ เส้นที่เชื่อมต่อกล่องแสดงความสัมพันธ์ระหว่างตาราง ความสัมพันธ์เหล่านี้อาจซับซ้อน แม้ในแบบจำลองเรียบง่ายก็ตาม แบบจําลองความหมายสามารถไม่เป็นระเบียบได้ง่าย และจํานวนรวมของตารางในแบบจําลองจะค่อยๆ เพิ่มขึ้น การรักษาแบบจําลองความหมายของคุณให้เรียบง่าย ครอบคลุม และแม่นยํานั้นต้องใช้ความพยายามอย่างต่อเนื่อง
มีการกำหนดความสัมพันธ์ระหว่างตารางผ่านคีย์หลักและคีย์นอก คีย์หลักคือคอลัมน์ที่ระบุแถวข้อมูลที่ไม่ซ้ำกัน ไม่เป็น null แต่ละแถว ตัวอย่างเช่น ถ้าคุณมีตาราง ลูกค้า คุณสามารถมีดัชนีที่ระบุลูกค้าแต่ละรายที่ไม่ซ้ำกันได้ แถวแรกมี ID เป็น 1 แถวที่สองมี ID เป็น 2 และอื่น ๆ แต่ละแถวจะได้รับการกำหนดค่าที่ไม่ซ้ำ ซึ่งสามารถอ้างอิงตามค่านี้ได้: คีย์หลัก กระบวนการนี้จะมีความสำคัญเมื่อคุณอ้างอิงแถวในตารางที่แตกต่างกัน ซึ่งเป็นสิ่งที่คีย์นอกทำ ความสัมพันธ์ระหว่างตารางถูกสร้างขึ้นเมื่อคุณมีคีย์หลักและคีย์นอก ที่ใช้ร่วมกันระหว่างตารางที่แตกต่างกัน
Power BI ช่วยในการสร้างความสัมพันธ์จากตารางที่มีแหล่งข้อมูลที่แตกต่างกัน ฟังก์ชันอันทรงพลังที่ช่วยให้คุณสามารถดึงข้อมูลตารางหนึ่งจาก Microsoft Excel และอีกหนึ่งจากฐานข้อมูลเชิงสัมพันธ์ได้ จากนั้นคุณจะสร้างความสัมพันธ์ระหว่างสองตารางเหล่านั้นและถือว่าเป็นแบบจําลองความหมายแบบรวม
หลังจากที่คุณได้เรียนรู้เกี่ยวกับความสัมพันธ์ที่สร้างสคีมาข้อมูลแล้ว คุณสามารถสํารวจการออกแบบสคีมาชนิดเฉพาะเจาะจง สคีมาแบบดาว ซึ่งได้รับการปรับให้เหมาะสมสําหรับประสิทธิภาพและการใช้งานสูง
สคีมาแบบดาว
คุณสามารถออกแบบสคีมาแบบดาวเพื่อทำให้ข้อมูลของคุณง่ายขึ้น นี่ไม่ใช่วิธีเดียวที่จะทำให้ข้อมูลของคุณง่ายขึ้น แต่เป็นวิธีที่ได้รับความนิยม ดังนั้นนักวิเคราะห์ข้อมูล Power BI ทุกคนควรทำความเข้าใจ สคีมาแบบดาว ตารางภายในแบบจําลองความหมายแต่ละตารางจะถูกกําหนดเป็นตารางมิติหรือตารางข้อเท็จจริง ดังที่แสดงในวิชวลต่อไปนี้
ตารางข้อเท็จจริง ประกอบด้วยค่าข้อมูลเชิงสังเกตการณ์หรือเหตุการณ์: คำสั่งขาย จำนวนผลิตภัณฑ์ ราคา วันที่และเวลาของการทำธุรกรรม และปริมาณ ตารางข้อเท็จจริงสามารถมีค่าซ้ำได้หลายค่า ตัวอย่างเช่น ผลิตภัณฑ์หนึ่งสามารถปรากฏได้หลายครั้งในหลายแถว สำหรับลูกค้าที่แตกต่างกันในวันที่แตกต่างกัน คุณสามารถรวมค่าเหล่านี้เพื่อสร้างวิชวลได้ ตัวอย่างเช่น วิชวลของคำสั่งขายทั้งหมดคือการรวมของคำสั่งขายทั้งหมดในตารางข้อเท็จจริง เนื่องด้วยตารางข้อเท็จจริง จึงเป็นเรื่องธรรมดาที่จะเห็นคอลัมน์ที่เต็มไปด้วยตัวเลขและวันที่ ตัวเลขอาจเป็นหน่วยของการวัด เช่น ยอดขายหรืออาจเป็นคีย์ เช่น รหัสลูกค้า วันที่แสดงเวลาที่ถูกบันทึก เช่น วันที่สั่งซื้อหรือวันที่จัดส่ง
ตารางมิติ ประกอบด้วยรายละเอียดเกี่ยวกับข้อมูลในตารางข้อเท็จจริง: ผลิตภัณฑ์ สถานที่ พนักงาน และชนิดคำสั่งซื้อ ตารางเหล่านี้เชื่อมต่อกับตารางข้อเท็จจริงผ่านคอลัมน์หลัก มีการใช้ตารางมิติในการกรองและจัดกลุ่มข้อมูลในตารางข้อเท็จจริง ในทางกลับกัน ตารางข้อเท็จจริงประกอบด้วยข้อมูลที่สามารถวัดได้ เช่น ยอดขายและรายได้ และแต่ละแถวแสดงชุดของค่าที่ไม่ซ้ํากันจากตารางมิติ สำหรับวิชวลคำสั่งขายทั้งหมด คุณสามารถจัดกลุ่มข้อมูลเพื่อให้คุณเห็นคำสั่งขายทั้งหมดตามผลิตภัณฑ์ซึ่งผลิตภัณฑ์เป็นข้อมูลในตารางมิติ
ตารางข้อเท็จจริงมีขนาดใหญ่กว่าตารางมิติเนื่องจากเหตุการณ์จํานวนมากเกิดขึ้นในตารางข้อเท็จจริง เช่น การขายแต่ละรายการ โดยทั่วไปตารางมิติจะเล็กกว่าเนื่องจากคุณจำกัด จำนวนรายการที่คุณสามารถกรองและจัดกลุ่มได้ ตัวอย่างเช่น ปีหนึ่งประกอบด้วยเพียงไม่กี่เดือนเท่านั้น และสหรัฐอเมริกาประกอบด้วยรัฐจํานวนหนึ่งที่แน่นอนเท่านั้น
เมื่อพิจารณาข้อมูลนี้เกี่ยวกับตารางข้อเท็จจริงและตารางมิติ คุณอาจสงสัยว่าคุณสามารถสร้างวิชวลนี้ใน Power BI ได้อย่างไร
ข้อมูลที่เกี่ยวข้องอยู่ในสองตารางได้แก่ ตารางพนักงานและยอดขาย ดังที่แสดงในแบบจําลองความหมายต่อไปนี้ เนื่องจากตารางยอดขายประกอบด้วยค่าคำสั่งขายซึ่งสามารถรวมได้ จะถือว่าเป็นตารางข้อเท็จจริง ตารางพนักงานประกอบด้วยชื่อพนักงานเฉพาะซึ่งกรองคำสั่งขาย ดังนั้นจึงเป็นตารางมิติ คอลัมน์ทั่วไประหว่างสองตาราง ซึ่งเป็นคีย์หลักในตารางพนักงานคือ EmployeeID ดังนั้นคุณสามารถสร้างความสัมพันธ์ระหว่างสองตารางโดยยึดตามคอลัมน์นี้ได้
เมื่อสร้างความสัมพันธ์นี้ คุณสามารถสร้างวิชวลตามข้อกำหนด ดังแสดงในรูปต่อไปนี้ หากคุณไม่ได้สร้างความสัมพันธ์นี้ คุณจะมีปัญหาในการสร้างวิชวลของคุณมากขึ้น ในขณะที่คำนึงถึงความธรรมดาสามัญระหว่างสองตาราง
สคีมาแบบดาวและแบบจําลองความหมายพื้นฐานเป็นพื้นฐานของรายงานที่มีการจัดระเบียบ ยิ่งคุณใช้เวลาในการสร้างการเชื่อมต่อและการออกแบบมากเท่าไหร่ ก็จะยิ่งสร้างและรักษารายงานได้ง่ายขึ้นเท่านั้น