Microsoft Fabric terminologi

Lær definisjonene av begreper som brukes i Microsoft Fabric, inkludert begreper som er spesifikke for Synapse Data Warehouse, Synapse Dataingeniør ing, Synapse Data Science, Synapse Real-Time Analytics, Data Factory og Power BI.

Generelle termer

  • Kapasitet: Kapasitet er et dedikert sett med ressurser som er tilgjengelig på et gitt tidspunkt som skal brukes. Kapasitet definerer en ressurss mulighet til å utføre en aktivitet eller produsere utdata. Ulike elementer bruker forskjellig kapasitet på et bestemt tidspunkt. Fabric tilbyr kapasitet gjennom Fabric SKU og Trials. Hvis du vil ha mer informasjon, kan du se Hva er kapasitet?

  • Opplevelse: En samling av funksjoner som er rettet mot en bestemt funksjonalitet. Stoffopplevelsene inkluderer Synapse Data Warehouse, Synapse Dataingeniør ing, Synapse Data Science, Synapse Real-Time Analytics, Data Factory og Power BI.

  • Element: Et element et sett med funksjoner i en opplevelse. Brukere kan opprette, redigere og slette dem. Hver elementtype har forskjellige funksjoner. For eksempel inkluderer Dataingeniør opplevelsen lakehouse, notatblokk og Spark jobbdefinisjonselementer.

  • Tenant: En leier er en enkelt forekomst av Fabric for en organisasjon og er justert med en Microsoft Entra ID.

  • Arbeidsområde: Et arbeidsområde er en samling elementer som samler ulike funksjoner i ett enkelt miljø som er utformet for samarbeid. Den fungerer som en beholder som bruker kapasitet for arbeidet som utføres, og gir kontroller for hvem som har tilgang til elementene i den. Brukere oppretter for eksempel rapporter, notatblokker, semantiske modeller osv. Hvis du vil ha mer informasjon, kan du se artikler om arbeidsområder .

Synapse-datateknikk

  • Lakehouse: Et lakehouse er en samling filer, mapper og tabeller som representerer en database over en datainnsjø som brukes av Apache Spark-motoren og SQL-motoren for behandling av store data. Et lakehouse inneholder forbedrede funksjoner for ACID-transaksjoner når du bruker deltaformaterte tabeller med åpen kildekode. Lakehouse-elementet driftes i en unik arbeidsområdemappe i Microsoft OneLake. Den inneholder filer i ulike formater (strukturerte og ustrukturerte) organisert i mapper og undermapper. Hvis du vil ha mer informasjon, kan du se Hva er et innsjøhus?

  • Notatblokk: En stoffnotatblokk er et interaktivt programmeringsverktøy med flere språk med rike funksjoner. Som inkluderer redigeringskode og markdown, kjøring og overvåking av en Spark-jobb, visning og visualiseringsresultat og samarbeid med teamet. Det hjelper dataingeniører og dataforskere med å utforske og behandle data, og bygge maskinlæringseksperimenter med både kode og lavkodeopplevelse. Det kan enkelt transformeres til en datasamlebåndaktivitet for orkestrering.

  • Spark-program: Et Apache Spark-program er et program skrevet av en bruker som bruker et av Sparks API-språk (Scala, Python, Spark SQL eller Java) eller Microsoft-lagt til språk (.NET med C# eller F#). Når et program kjører, er det delt inn i én eller flere Spark-jobber som kjører parallelt for å behandle dataene raskere. Hvis du vil ha mer informasjon, kan du se Spark-programovervåking.

  • Apache Spark-jobb: En Spark-jobb er en del av et Spark-program som kjøres parallelt med andre jobber i programmet. En jobb består av flere aktiviteter. Hvis du vil ha mer informasjon, kan du se Spark-jobbovervåking.

  • Apache Spark-jobbdefinisjon: En Spark-jobbdefinisjon er et sett med parametere, angitt av brukeren, som angir hvordan et Spark-program skal kjøres. Den lar deg sende inn satsvise jobber eller strømmingsjobber til Spark-klyngen. Hvis du vil ha mer informasjon, kan du se Hva er en Apache Spark-jobbdefinisjon?

  • V-rekkefølge: En skriveoptimalisering til parkettfilformatet som muliggjør rask lesing og gir kostnadseffektivitet og bedre ytelse. Alle Fabric-motorene skriver v-bestilte parkettfiler som standard.

Data Factory

  • Koble til eller: Data Factory tilbyr et rikt sett med koblinger som lar deg koble til ulike typer datalagre. Når du er tilkoblet, kan du transformere dataene. Hvis du vil ha mer informasjon, kan du se koblinger.

  • Datasamlebånd: I Data Factory brukes et datasamlebånd til orkestrering av databevegelse og transformasjon. Disse datasamlebåndene er forskjellige fra utrullingssamlebåndene i Fabric. Hvis du vil ha mer informasjon, kan du se Pipelines i oversikten over Data Factory.

  • Dataflyt gen2: Dataflyter gir et grensesnitt med lav kode for inntak av data fra hundrevis av datakilder og transformering av dataene. Dataflyter i Fabric kalles Dataflyt gen2. Dataflyt gen1 finnes i Power BI. Dataflyt gen2 tilbyr ekstra funksjoner sammenlignet med dataflyter i Azure Data Factory eller Power BI. Du kan ikke oppgradere fra Gen1 til Gen2. Hvis du vil ha mer informasjon, kan du se Dataflyter i oversikten over Data Factory.

Synapse-datavitenskap

  • Data Wrangler: Data Wrangler er et notatblokkbasert verktøy som gir brukerne en engasjerende opplevelse for å utføre utforskende dataanalyse. Funksjonen kombinerer en rutenettlignende datavisning med dynamisk sammendragsstatistikk og et sett med vanlige datarensingsoperasjoner, som alle er tilgjengelige med noen få valgte ikoner. Hver operasjon genererer kode som kan lagres tilbake til notatblokken som et gjenbrukbart skript.

  • Eksperiment: Et maskinlæringseksperiment er den primære enheten for organisering og kontroll for alle relaterte maskinlæringskjøringer. Hvis du vil ha mer informasjon, kan du se Maskinlæringseksperimenter i Microsoft Fabric.

  • Modell: En maskinlæringsmodell er en fil som er opplært til å gjenkjenne visse typer mønstre. Du lærer opp en modell over et sett med data, og du gir den en algoritme som den bruker til å resonnere og lære av dette datasettet. Hvis du vil ha mer informasjon, kan du se Maskinlæringsmodell.

  • Kjør: En kjøring tilsvarer en enkelt kjøring av modellkode. I MLflow er sporing basert på eksperimenter og kjøringer.

Synapse-datalager

  • Endepunkt for SQL-analyse: Hvert Lakehouse har et SQL Analytics-endepunkt som gjør det mulig for en bruker å spørre deltatabelldata med TSQL over TDS. Hvis du vil ha mer informasjon, kan du se endepunktet for SQL-analyse.

  • Synapse Data Warehouse: Synapse Data Warehouse fungerer som et tradisjonelt datalager og støtter de fullstendige transaksjonelle T-SQL-funksjonene du forventer fra et virksomhetsdatalager. Hvis du vil ha mer informasjon, kan du se Synapse Data Warehouse.

Synapse-sanntidsanalyse

  • KQL-database: KQL-databasen inneholder data i et format som du kan kjøre KQL-spørringer mot. Hvis du vil ha mer informasjon, kan du se Spørre en KQL-database.

  • KQL-spørringssett: KQL-spørringssettet er elementet som brukes til å kjøre spørringer, vise resultater og manipulere spørringsresultater på data fra DataUtforsker-databasen. Spørringssettet inneholder databasene og tabellene, spørringene og resultatene. Med KQL-spørringssettet kan du lagre spørringer for fremtidig bruk, eller eksportere og dele spørringer med andre. Hvis du vil ha mer informasjon, kan du se Spørringsdata i KQL-spørringssettet

  • Hendelsesstrøm: Funksjonen Microsoft Fabric-hendelsesstrømmer gir et sentralisert sted i Fabric-plattformen for å fange opp, transformere og rute sanntidshendelser til destinasjoner med en no-code-opplevelse. En hendelsesstrøm består av ulike datakilder for strømming, inntaksmål og en hendelsesprosessor når transformasjonen er nødvendig. Hvis du vil ha mer informasjon, kan du se Hendelsesstrømmer for Microsoft Fabric.

OneLake

  • Snarvei: Snarveier er innebygde referanser i OneLake som peker til andre plasseringer i fillageret. De gir deg mulighet til å koble til eksisterende data uten å måtte kopiere dem direkte. Hvis du vil ha mer informasjon, kan du se OneLake-snarveier.