Del via


Brug SQL-databasen som et operationelt datalager

Gælder for:SQL-database i Microsoft Fabric

Denne artikel skitserer, hvordan man implementerer et operationelt datalager (ODS) ved brug af SQL-database i Fabric. Den giver arkitektonisk vejledning, designmønstre, arbejdsbelastningskarakteristika og Fabric-specifikke overvejelser for at opbygge en sikker, performant og styret ODS.

Diagram over brugsscenariet for SQL-databaser i Fabric som en operationel datalagring (ODS).

Hvad er en ODS?

Et operationelt datalager (ODS) er et emneorienteret, integreret og næsten realtidslager, der konsoliderer data fra flere driftssystemer i en let kurateret, normaliseret model – typisk i normaliserede skemaer. Det understøtter operationel rapportering, letvægtsanalyse, API-servering og downstream udbredelse til analytiske lag som Fabric Warehouse eller Fabric Lakehouse.

Et ODS er ikke et kilde-online transaktionsbehandlingssystem (OLTP) eller et dimensionelt lager.

I stedet fungerer den som den "varme, harmoniserede sandhed" for de sidste N minutter, timer eller dage, siddende mellem kildesystemer og analytiske platforme.

Nøglekarakteristika ved en ODS

Et operationelt datalager (ODS) i Microsoft Fabric er designet til at levere et næsten realtidsoverblik over driftsdata med stærke styrings- og ydelsesgarantier.

  • Den indsamler data fra flere kildesystemer med lav latenstid.
  • Skemaet normaliseres typisk i tredje normalform (3NF) for at understøtte fleksibilitet og sporbarhed.
  • Datakvalitet håndhæves gennem deduplikering, identitetsløsning og håndtering af sent ankommende eller blødt slettede poster, hvilket skaber et pålideligt fundament for operationel rapportering og downstream-analyser.
  • Servingmønstre omfatter SQL-baserede forespørgsler, operationelle dashboards, advarsler og API'er, mens Fabric-styringsfunktioner sikrer overholdelse og sikkerhed gennem hele datalivscyklussen.

SQL-database i Fabric fungerer som en sikker og effektiv kanal mellem operationelle data og analytiske platforme.

Komponenter

Følgende komponenter er involveret i brugen af SQL-databaser i Fabric som et operationelt datalager:

  • Begrænsninger og nøgler: Håndhæv forretningslogik og referentiel integritet (naturlige nøgler, surrogatnøgler, fremmednøgler).
  • Identitetsopløsning: Dedupliker på tværs af kilder; Anvend overlevelsesregler.
  • Serving: Eksponér GraphQL-endpoints og/eller byg Power BI-dashboards.

Bedste praksis for indtagelse og arbejdsbelastning

At bygge en ODS på SQL-database i Fabric kræver indtagelsesstrategier, der balancerer friskhed, pålidelighed og ydeevne.

  • Batch- og inkrementelle belastninger orkestreres typisk gennem Fabric Data Pipelines ved hjælp af change data capture-aktiverede connectors, med vandmærkning og genprøvningslogik for at sikre konsistens.
    • Oppas pipeline-samtidighed, så SQL-databasen kan skaleres under spidsbelastninger, samtidig med at serviceniveau-målene for dataaktualitet opfyldes.
    • Vandmærkning er et vigtigt begreb i inkrementelle kopieringsprocesser. Det hjælper dig med nemt at identificere, hvor en inkrementell belastning sidst stoppede.
  • Udfør tunge transformationer opstrøms i Dataflow Gen2 eller Spark Notebooks. Reserver SQL-laget til de endelige MERGE operationer, der håndhæver begrænsninger og opretholder OLTP-lignende ydeevne.
  • Brug idempotente designmønstre, der kombinerer ændringsdetektion, vandmærkning, T-SQL MERGE og kontroltabeller for sikre genstarter og operationel robusthed.

Motor og miljø

SQL-databasen i Fabric er baseret på samme SQL Database Engine som Azure SQL Database, hvilket leverer en velkendt T-SQL-oplevelse med fuld kompatibilitet for standard klientværktøjer.

Ved at bruge SQL-databasen i Microsoft Fabric kan du skabe end-to-end workflows fra indlæsning til analyse ved at bruge andre funktioner i Microsoft Fabric:

  • Datapipelines
  • Dataflow Gen2
  • Notebooks
  • Intelligence i realtid
  • Power BI
  • Alt sammen med strømlinet DevOps ved brug af Git-baseret CI/CD