แชร์ผ่าน


ใช้ฐานข้อมูล SQL เป็นที่เก็บข้อมูลการดําเนินงาน

นําไปใช้กับ:ฐานข้อมูล SQL ใน Microsoft Fabric

บทความนี้สรุปวิธีการใช้ ที่เก็บข้อมูลการดําเนินงาน (ODS) โดยใช้ฐานข้อมูล SQL ใน Fabric รูปแบบการออกแบบ ลักษณะปริมาณงาน และข้อควรพิจารณาเฉพาะของ Fabric สําหรับการสร้าง ODS ที่ปลอดภัย มีประสิทธิภาพ และอยู่ภายใต้การควบคุม

ไดอะแกรมของกรณีการใช้งานสําหรับฐานข้อมูล SQL ใน Fabric เป็นที่เก็บข้อมูลการดําเนินงาน (ODS)

ODS คืออะไร?

ที่เก็บข้อมูลการดําเนินงาน (ODS) เป็นที่เก็บข้อมูลที่มุ่งเน้นหัวเรื่อง แบบบูรณาการ และใกล้เคียงแบบเรียลไทม์ ซึ่งรวมข้อมูลจากระบบปฏิบัติการหลายระบบไว้ในแบบจําลองที่ได้รับการดูแลจัดการอย่างเบาบางและเป็นมาตรฐาน รองรับการรายงานการดําเนินงาน การวิเคราะห์แบบไม่ซับซ้อน การให้บริการ API และการเผยแพร่ปลายน้ําไปยังเลเยอร์การวิเคราะห์ เช่น Fabric Warehouse หรือ Fabric Lakehouse

ODS ไม่ใช่ ระบบการประมวลผลธุรกรรมออนไลน์ต้นทาง (OLTP) หรือคลังสินค้ามิติ

แต่ทําหน้าที่เป็น "ความจริงที่ร้อนแรงและกลมกลืนกัน" ในช่วง N นาที ชั่วโมง หรือวันสุดท้าย โดยอยู่ระหว่างระบบต้นทางและแพลตฟอร์มการวิเคราะห์

ลักษณะสําคัญของ ODS

ที่เก็บข้อมูลการดําเนินงาน (ODS) ใน Microsoft Fabric ได้รับการออกแบบมาเพื่อส่งมอบมุมมองข้อมูลการดําเนินงานแบบเกือบเรียลไทม์พร้อมการกํากับดูแลที่แข็งแกร่งและการรับประกันประสิทธิภาพ

  • นําเข้าข้อมูลจากระบบต้นทางหลายระบบโดยมีเวลาแฝงต่ํา
  • โดยทั่วไปแล้วสคีมาจะถูกทําให้เป็นมาตรฐานในรูปแบบปกติที่สาม (3NF) เพื่อรองรับความยืดหยุ่นและการตรวจสอบย้อนกลับ
  • คุณภาพของข้อมูลถูกบังคับใช้ผ่านการขจัดข้อมูลซ้ําซ้อน การแก้ไขข้อมูลประจําตัว และการจัดการบันทึกที่มาถึงล่าช้าหรือถูกลบแบบชั่วคราว ซึ่งสร้างรากฐานที่เชื่อถือได้สําหรับการรายงานการดําเนินงานและการวิเคราะห์ดาวน์สตรีม
  • รูปแบบการให้บริการประกอบด้วยการสืบค้นที่ใช้ SQL, แดชบอร์ดการดําเนินงาน, การแจ้งเตือน และ API ในขณะที่คุณสมบัติการกํากับดูแล Fabric ช่วยให้มั่นใจได้ถึงการปฏิบัติตามข้อกําหนดและความปลอดภัยตลอดวงจรชีวิตของข้อมูล

ฐานข้อมูล SQL ใน Fabric ทําหน้าที่เป็นช่องทางที่ปลอดภัยและมีประสิทธิภาพระหว่างข้อมูลการดําเนินงานและแพลตฟอร์มการวิเคราะห์

คอมโพเนนต์

ส่วนประกอบต่อไปนี้เกี่ยวข้องกับการใช้ฐานข้อมูล SQL ใน Fabric เป็นที่เก็บข้อมูลการดําเนินงาน:

  • ข้อจํากัดและคีย์: บังคับใช้ตรรกะทางธุรกิจและความสมบูรณ์ของการอ้างอิง (คีย์ธรรมชาติ คีย์ตัวแทน คีย์ต่างประเทศ)
  • การแก้ปัญหาข้อมูลประจําตัว: ขจัดความซ้ําซ้อนข้ามแหล่งที่มา ใช้กฎการรอดชีวิต
  • การให้บริการ: แสดงจุดสิ้นสุด GraphQL และ/หรือสร้างแดชบอร์ด Power BI

แนวทางปฏิบัติที่ดีที่สุดเกี่ยวกับการนําเข้าและปริมาณงาน

การสร้างฐานข้อมูล ODS บน SQL ใน Fabric ต้องใช้กลยุทธ์การนําเข้าที่สร้างสมดุลระหว่างความสดใหม่ ความน่าเชื่อถือ และประสิทธิภาพ

  • โดยทั่วไปแล้วการโหลดแบบแบทช์และส่วนเพิ่มจะได้รับการประสานผ่าน Fabric Data Pipelines โดยใช้ตัวเชื่อมต่อที่เปิดใช้งานการบันทึกข้อมูลการเปลี่ยนแปลง พร้อมลายน้ําและตรรกะการลองใหม่เพื่อให้มั่นใจถึงความสอดคล้องกัน
    • ปรับแต่งไปป์ไลน์พร้อมกันเพื่อให้ฐานข้อมูล SQL ปรับขนาดได้ในระหว่างการโหลดสูงสุดในขณะที่เป็นไปตามวัตถุประสงค์ระดับการบริการเพื่อความใหม่ของข้อมูล
    • การใส่ลายน้ําเป็นแนวคิดที่สําคัญในกระบวนการคัดลอกที่เพิ่มขึ้น ช่วยให้คุณระบุตําแหน่งที่โหลดที่เพิ่มขึ้นหยุดลงล่าสุดได้อย่างง่ายดาย
  • ทําการแปลงจํานวนมากอัปสตรีมในกระแสข้อมูล Gen2 หรือ Spark Notebooks จองเลเยอร์ SQL สําหรับการดําเนินการขั้นสุดท้าย MERGE ที่บังคับใช้ข้อจํากัดและรักษาประสิทธิภาพเหมือน OLTP
  • ใช้รูปแบบการออกแบบที่สมบูรณ์แบบซึ่งรวมการตรวจจับการเปลี่ยนแปลง ลายน้ํา T-SQL MERGE และตารางควบคุมเพื่อการรีสตาร์ทที่ปลอดภัยและความยืดหยุ่นในการปฏิบัติงาน

เครื่องยนต์และสิ่งแวดล้อม

ฐานข้อมูล SQL ใน Fabric ใช้กลไกจัดการฐานข้อมูล SQL เดียวกันกับฐานข้อมูล Azure SQL ซึ่งมอบประสบการณ์ T-SQL ที่คุ้นเคยพร้อมความเข้ากันได้อย่างสมบูรณ์สําหรับเครื่องมือไคลเอ็นต์มาตรฐาน

ด้วยการใช้ฐานข้อมูล SQL ใน Microsoft Fabric คุณสามารถสร้างเวิร์กโฟลว์แบบ end-to-end จากการนําเข้าไปจนถึงการวิเคราะห์โดยใช้คุณลักษณะอื่นๆ ใน Microsoft Fabric:

  • ไปป์ไลน์ข้อมูล
  • กระแสข้อมูล Gen2
  • Notebooks
  • ข่าวกรอง Real-Time
  • Power BI
  • ทั้งหมดนี้มาพร้อมกับ DevOps ที่คล่องตัวโดยใช้ CI/CD ที่ใช้ Git