Dela via


Använda SQL Database som ett driftdatalager

Gäller för:SQL-databas i Microsoft Fabric

Den här artikeln beskriver hur du implementerar ett driftdatalager (ODS) med hjälp av SQL Database i Fabric. Det ger arkitekturvägledning, designmönster, arbetsbelastningsegenskaper och infrastrukturspecifika överväganden för att skapa en säker, högpresterande och styrd ODS.

Diagram över användningsfallet för SQL-databasen i Fabric som ett driftdatalager (ODS).

Vad är en ODS?

Ett driftdatalager (ODS) är ett ämnesorienterat, integrerat och nära realtidslager som konsoliderar data från flera driftsystem till en lätt kuraterad, normaliserad modell – vanligtvis i normaliserade scheman. Den stöder driftrapportering, lättanalys, API-servering och nedströmsspridning till analyslager som Fabric Warehouse eller Fabric Lakehouse.

En ODS är inte ett OLTP-system (Source Online Transaction Processing) eller ett dimensionellt lager.

I stället fungerar den som den "heta, harmoniserade sanningen" för de senaste N minuterna, timmarna eller dagarna, som sitter mellan källsystem och analysplattformar.

Viktiga egenskaper för en ODS

Ett driftdatalager (ODS) i Microsoft Fabric är utformat för att ge en nästan realtidsvy över driftdata med starka styrnings- och prestandagarantier.

  • Den matar in data från flera källsystem med låg svarstid.
  • Schemat normaliseras vanligtvis i tredje normal form (3NF), för att stödja flexibilitet och spårning.
  • Datakvaliteten framtvingas genom deduplicering, identitetsmatchning och hantering av poster som har kommit sent eller tagits bort, vilket skapar en tillförlitlig grund för driftrapportering och nedströmsanalys.
  • Serveringsmönster omfattar SQL-baserade frågor, operativa instrumentpaneler, aviseringar och API:er, medan infrastrukturstyrningsfunktioner säkerställer efterlevnad och säkerhet i hela datalivscykeln.

SQL-databasen i Fabric fungerar som en säker och effektiv kanal mellan driftdata och analysplattformar.

Components

Följande komponenter ingår i användningen av SQL Database i Fabric som ett driftdatalager:

  • Begränsningar och nycklar: Framtvinga affärslogik och referensintegritet (naturliga nycklar, surrogatnycklar, sekundärnycklar).
  • Identitetslösning: Deduplicera mellan källor; tillämpa överlevnadsregler.
  • Servering: Exponera GraphQL-slutpunkter och/eller skapa Power BI-instrumentpaneler.

Metodtips för inmatning och arbetsbelastning

Att skapa en ODS på SQL-databas i Fabric kräver inmatningsstrategier som balanserar färskhet, tillförlitlighet och prestanda.

  • Batch- och inkrementell dataladdning dirigeras vanligtvis via Fabric Data Pipelines med hjälp av anslutningskontakter aktiverade för ändringsdatainsamling, med vattenmärkning och omförsökslogik för att säkerställa konsekvens.
    • Justera samtidigheten i pipelinen för att möjliggöra att SQL-databasen kan skalas vid hög belastning och samtidigt uppfylla servicenivåmål för dataaktualitet.
    • Vattenstämpel är ett viktigt begrepp i inkrementella kopieringsprocesser. Det hjälper dig att enkelt identifiera var en inkrementell belastning senast stoppades.
  • Utför tunga transformeringar uppströms i Dataflow Gen2 eller Spark Notebooks. Reservera SQL-lagret för slutgiltiga MERGE åtgärder som framtvingar begränsningar och underhåller OLTP-liknande prestanda.
  • Använd idempotent designmönster som kombinerar ändringsidentifiering, vattenstämpling, T-SQL MERGE och kontrolltabeller för säkra omstarter och driftsresiliens.

Motor och miljö

SQL-databasen i Fabric baseras på samma SQL Database-motor som Azure SQL Database, vilket ger en välbekant T-SQL-upplevelse med fullständig kompatibilitet för standardklientverktyg.

Genom att använda SQL Database i Microsoft Fabric kan du skapa arbetsflöden från slutpunkt till slutpunkt från inmatning till analys med hjälp av andra funktioner i Microsoft Fabric:

  • Datapipelines
  • Dataflöde Gen2
  • Notebooks
  • Realtidsinformation
  • Power BI
  • Allt genom att använda ett effektivt DevOps-system med hjälp av Git-baserad CI/CD.