หมายเหตุ
การเข้าถึงหน้านี้ต้องได้รับการอนุญาต คุณสามารถลอง ลงชื่อเข้าใช้หรือเปลี่ยนไดเรกทอรีได้
การเข้าถึงหน้านี้ต้องได้รับการอนุญาต คุณสามารถลองเปลี่ยนไดเรกทอรีได้
นําไปใช้กับ:✅ฐานข้อมูล SQL ใน Microsoft Fabric
บทความนี้สรุปวิธีการใช้ ที่เก็บข้อมูลการดําเนินงาน (ODS) โดยใช้ฐานข้อมูล SQL ใน Fabric รูปแบบการออกแบบ ลักษณะปริมาณงาน และข้อควรพิจารณาเฉพาะของ Fabric สําหรับการสร้าง ODS ที่ปลอดภัย มีประสิทธิภาพ และอยู่ภายใต้การควบคุม
ODS คืออะไร?
ที่เก็บข้อมูลการดําเนินงาน (ODS) เป็นที่เก็บข้อมูลที่มุ่งเน้นหัวเรื่อง แบบบูรณาการ และใกล้เคียงแบบเรียลไทม์ ซึ่งรวมข้อมูลจากระบบปฏิบัติการหลายระบบไว้ในแบบจําลองที่ได้รับการดูแลจัดการอย่างเบาบางและเป็นมาตรฐาน รองรับการรายงานการดําเนินงาน การวิเคราะห์แบบไม่ซับซ้อน การให้บริการ API และการเผยแพร่ปลายน้ําไปยังเลเยอร์การวิเคราะห์ เช่น Fabric Warehouse หรือ Fabric Lakehouse
ODS ไม่ใช่ ระบบการประมวลผลธุรกรรมออนไลน์ต้นทาง (OLTP) หรือคลังสินค้ามิติ
แต่ทําหน้าที่เป็น "ความจริงที่ร้อนแรงและกลมกลืนกัน" ในช่วง N นาที ชั่วโมง หรือวันสุดท้าย โดยอยู่ระหว่างระบบต้นทางและแพลตฟอร์มการวิเคราะห์
ลักษณะสําคัญของ ODS
ที่เก็บข้อมูลการดําเนินงาน (ODS) ใน Microsoft Fabric ได้รับการออกแบบมาเพื่อส่งมอบมุมมองข้อมูลการดําเนินงานแบบเกือบเรียลไทม์พร้อมการกํากับดูแลที่แข็งแกร่งและการรับประกันประสิทธิภาพ
- นําเข้าข้อมูลจากระบบต้นทางหลายระบบโดยมีเวลาแฝงต่ํา
- โดยทั่วไปแล้วสคีมาจะถูกทําให้เป็นมาตรฐานในรูปแบบปกติที่สาม (3NF) เพื่อรองรับความยืดหยุ่นและการตรวจสอบย้อนกลับ
- คุณภาพของข้อมูลถูกบังคับใช้ผ่านการขจัดข้อมูลซ้ําซ้อน การแก้ไขข้อมูลประจําตัว และการจัดการบันทึกที่มาถึงล่าช้าหรือถูกลบแบบชั่วคราว ซึ่งสร้างรากฐานที่เชื่อถือได้สําหรับการรายงานการดําเนินงานและการวิเคราะห์ดาวน์สตรีม
- รูปแบบการให้บริการประกอบด้วยการสืบค้นที่ใช้ SQL, แดชบอร์ดการดําเนินงาน, การแจ้งเตือน และ API ในขณะที่คุณสมบัติการกํากับดูแล Fabric ช่วยให้มั่นใจได้ถึงการปฏิบัติตามข้อกําหนดและความปลอดภัยตลอดวงจรชีวิตของข้อมูล
ฐานข้อมูล SQL ใน Fabric ทําหน้าที่เป็นช่องทางที่ปลอดภัยและมีประสิทธิภาพระหว่างข้อมูลการดําเนินงานและแพลตฟอร์มการวิเคราะห์
คอมโพเนนต์
ส่วนประกอบต่อไปนี้เกี่ยวข้องกับการใช้ฐานข้อมูล SQL ใน Fabric เป็นที่เก็บข้อมูลการดําเนินงาน:
- ข้อจํากัดและคีย์: บังคับใช้ตรรกะทางธุรกิจและความสมบูรณ์ของการอ้างอิง (คีย์ธรรมชาติ คีย์ตัวแทน คีย์ต่างประเทศ)
- การแก้ปัญหาข้อมูลประจําตัว: ขจัดความซ้ําซ้อนข้ามแหล่งที่มา ใช้กฎการรอดชีวิต
- การให้บริการ: แสดงจุดสิ้นสุด GraphQL และ/หรือสร้างแดชบอร์ด Power BI
แนวทางปฏิบัติที่ดีที่สุดเกี่ยวกับการนําเข้าและปริมาณงาน
การสร้างฐานข้อมูล ODS บน SQL ใน Fabric ต้องใช้กลยุทธ์การนําเข้าที่สร้างสมดุลระหว่างความสดใหม่ ความน่าเชื่อถือ และประสิทธิภาพ
- โดยทั่วไปแล้วการโหลดแบบแบทช์และส่วนเพิ่มจะได้รับการประสานผ่าน Fabric Data Pipelines โดยใช้ตัวเชื่อมต่อที่เปิดใช้งานการบันทึกข้อมูลการเปลี่ยนแปลง พร้อมลายน้ําและตรรกะการลองใหม่เพื่อให้มั่นใจถึงความสอดคล้องกัน
- ปรับแต่งไปป์ไลน์พร้อมกันเพื่อให้ฐานข้อมูล SQL ปรับขนาดได้ในระหว่างการโหลดสูงสุดในขณะที่เป็นไปตามวัตถุประสงค์ระดับการบริการเพื่อความใหม่ของข้อมูล
- การใส่ลายน้ําเป็นแนวคิดที่สําคัญในกระบวนการคัดลอกที่เพิ่มขึ้น ช่วยให้คุณระบุตําแหน่งที่โหลดที่เพิ่มขึ้นหยุดลงล่าสุดได้อย่างง่ายดาย
- ทําการแปลงจํานวนมากอัปสตรีมในกระแสข้อมูล Gen2 หรือ Spark Notebooks จองเลเยอร์ SQL สําหรับการดําเนินการขั้นสุดท้าย
MERGEที่บังคับใช้ข้อจํากัดและรักษาประสิทธิภาพเหมือน OLTP - ใช้รูปแบบการออกแบบที่สมบูรณ์แบบซึ่งรวมการตรวจจับการเปลี่ยนแปลง ลายน้ํา T-SQL MERGE และตารางควบคุมเพื่อการรีสตาร์ทที่ปลอดภัยและความยืดหยุ่นในการปฏิบัติงาน
เครื่องยนต์และสิ่งแวดล้อม
ฐานข้อมูล SQL ใน Fabric ใช้กลไกจัดการฐานข้อมูล SQL เดียวกันกับฐานข้อมูล Azure SQL ซึ่งมอบประสบการณ์ T-SQL ที่คุ้นเคยพร้อมความเข้ากันได้อย่างสมบูรณ์สําหรับเครื่องมือไคลเอ็นต์มาตรฐาน
ด้วยการใช้ฐานข้อมูล SQL ใน Microsoft Fabric คุณสามารถสร้างเวิร์กโฟลว์แบบ end-to-end จากการนําเข้าไปจนถึงการวิเคราะห์โดยใช้คุณลักษณะอื่นๆ ใน Microsoft Fabric:
- ไปป์ไลน์ข้อมูล
- กระแสข้อมูล Gen2
- Notebooks
- ข่าวกรอง Real-Time
- Power BI
- ทั้งหมดนี้มาพร้อมกับ DevOps ที่คล่องตัวโดยใช้ CI/CD ที่ใช้ Git