Arbeidsbelastningsadministrasjon

Gjelder for:✅ SQL Analytics-endepunkt og Warehouse i Microsoft Fabric

Denne artikkelen beskriver arkitekturen og arbeidsbelastningsstyringen i Fabric Data Warehouse.

Databehandling

Endepunktet for lageranalyse og SQL-analyse deler den samme underliggende behandlingsarkitekturen. Når Fabric henter eller tar inn data, håndterer en distribuert motor både små og store data og beregningsfunksjoner.

Behandlingssystemet er serverløst i denne serverdeldatabehandlingskapasiteten skaleres opp og ned autonomt for å møte arbeidsbelastningskravene.

Diagram over SQL-motoren.

Når en spørring sendes, utfører SQL frontend (FE) spørringsoptimalisering for å finne den beste planen basert på datastørrelse og kompleksitet. Når planen er generert, sendes den til Distributed Query Processing (DQP)-motoren. DQP orkestrerer distribuert kjøring av spørringen ved å dele den opp i mindre spørringer som utføres på serverdelberegningsnoder. Hver liten spørring er en oppgave og representerer en distribuert utførelsesenhet. Den leser filer fra OneLake, kobler sammen resultater fra andre oppgaver, grupper, eller bestiller data hentet fra andre oppgaver. For inntaksjobber skriver den også data til de riktige måltabellene.

Når data behandles, returneres resultatene til SQL-frontend for å tjene tilbake til brukeren eller anropsprogrammet.

Elastisitet og robusthet

Backend-databehandlingskapasitet drar nytte av en rask klargjøringsarkitektur. Selv om det ikke finnes noen SLA for ressurstildeling, blir nye noder vanligvis anskaffet innen noen sekunder. Etter hvert som ressursetterspørselen øker, bruker nye arbeidsbelastninger den utskalerte kapasiteten. Skalering er en tilkoblet operasjon, og spørringsbehandlingen blir uavbrutt.

Diagram som viser rask klargjøring av ressurser.

Systemet er feiltolerante, og hvis en node blir usunn, distribueres operasjoner som utføres på noden til sunne noder for fullføring.

Lager- og SQL-analyse-endepunkt gir burstbar kapasitet som gjør at arbeidsbelastninger kan bruke flere ressurser for å oppnå bedre ytelse, og bruke smoothing for å tilby avlastning for kunder som skaper plutselige topper i rushtiden og har ledig kapasitet som står ubrukt på andre tidspunkter. Utjevning forenkler kapasitetsstyring ved å spre evalueringen av databehandling for å sikre at kundejobber kjører jevnt og effektivt.

Planlegging og omsourcing

Planleggeren for distribuert spørringsbehandling opererer på oppgavenivå. Spørringer representeres for planleggeren som en rettet acyklisk graf (DAG) av aktiviteter. Dette konseptet er kjent for Spark-brukere. En DAG tillater parallellitet og samtidighet, ettersom oppgaver som ikke er avhengige av hverandre kan utføres samtidig eller i feil rekkefølge.

Etter hvert som spørringer kommer, planlegges oppgavene deres basert på først-i-første-ut -prinsipper (FIFO). Hvis det er ledig kapasitet, kan planleggeren bruke en "best fit"-tilnærming for å optimalisere samtidighet.

Når planleggeren identifiserer resourcing-trykk, aktiveres en skalaoperasjon. Skalering administreres autonomt og backend topologi vokser etter hvert som samtidighet øker. Siden det tar noen sekunder å skaffe noder, er ikke systemet optimalisert for konsekvent subsecond-ytelse for spørringer som krever distribuert behandling.

Når trykket avtar, skalerer backend topologi ned igjen og frigjør ressurs tilbake til området.

Beregningspoolisolasjon

Gjelder for:✅ Lager i Microsoft Fabric

Kapasitets-SKU-en som tildeles et arbeidsområde bestemmer den totale beregningen tilgjengelig for SQL-analyseendepunktet. Denne beregningen deles likt (50/50) i to isolerte ressurspooler for brukerforespørsler å bruke:

SELECT Pool – Håndterer alle SELECT spørringer.
Non-SELECT Pool - Håndterer alle ikke-forespørslerSELECT , som ETL eller inntaksoperasjoner.

Hver pool skalerer uavhengig basert på forespørsel, men overstiger aldri 50% av total beregning for SQL-analyse-endepunktet. Denne separasjonen forhindrer ressurskonkurranse, og sikrer at inntaksarbeidsmengder kjører på dedikert beregning optimalisert for ETL uten å påvirke leseforespørsler. Resultatet er forbedret ytelse og pålitelighet for begge spørringstypene.

Diagram som viser isolering av inntaksaktiviteter.

Merk

Og SELECT ikke-pool-isolasjonenSELECT er standard autonom arbeidsbelastningshåndtering som brukes på alle arbeidsområder. Imidlertid kan arbeidsområdeadministratorer tilpasse dette ved å bruke egendefinerte SQL-pooler.

Økter

Warehouse- og SQL-analyseendepunktet har en brukerøkt på 724 per arbeidsområde. Når denne grensen er nådd, returneres en feil: The user session limit for the workspace is 724 and has been reached.

Merk

Siden Microsoft Fabric er en SaaS-plattform, er det mange systemtilkoblinger som kjører for å kontinuerlig optimalisere miljøet. DMV-er viser både system- og brukerøkter. Hvis du vil ha mer informasjon, kan du se Overvåke tilkoblinger, økter og forespørsler ved hjelp av DMV-er.

Beste fremgangsmåter

Microsoft Fabric-arbeidsområdet gir en naturlig isolasjonsgrense for det distribuerte databehandlingssystemet. Arbeidsbelastninger kan dra nytte av denne grensen for å administrere både kostnader og ytelse.

OneLake-snarveier kan brukes til å opprette skrivebeskyttede replikaer av tabeller i andre arbeidsområder for å distribuere belastning på tvers av flere SQL-motorer, noe som oppretter en isolasjonsgrense. Dette kan effektivt øke maksimalt antall økter som utfører skrivebeskyttede spørringer.

Diagram som viser isolering av to arbeidsområder, for eksempel finans- og markedsføringsarbeidsområdet.

Tilbakemeldinger

Var denne siden nyttig?

Last updated on 2026-03-18