Hva er et lakehouse i Microsoft Fabric?

2025-02-05

Microsoft Fabric Lakehouse er en dataarkitekturplattform for lagring, administrasjon og analyse av strukturerte og ustrukturerte data på ett sted. Det er en fleksibel og skalerbar løsning som gjør det mulig for organisasjoner å håndtere store mengder data ved hjelp av ulike verktøy og rammeverk for å behandle og analysere disse dataene. Den integreres med andre verktøy for databehandling og analyse for å gi en omfattende løsning for datateknikk og analyse. Et lakehouse kombinerer skalerbarheten til en datainnsjø med ytelsen og strukturen til et datalager, noe som gir en enhetlig plattform for datalagring, administrasjon og analyse.

Endepunkt for SQL-analyse i Lakehouse

Lakehouse oppretter et serveringslag ved automatisk å generere et SQL Analytics-endepunkt og en standard semantisk modell under oppretting. Denne nye gjennomsiktige funksjonaliteten gjør det mulig for brukeren å arbeide direkte oppå Delta-tabellene i innsjøen for å gi en friksjonsfri og performant opplevelse hele veien fra datainntak til rapportering.

Det er viktig å være oppmerksom på at SQL Analytics-endepunktet er en skrivebeskyttet opplevelse og ikke støtter det fullstendige T-SQL-overflateområdet i et transaksjonsdatalager.

Notat

Bare tabellene i Delta-format er tilgjengelige i SQL Analytics-endepunktet. Parquet, CSV og andre formater kan ikke spørres ved hjelp av SQL Analytics-endepunktet. Hvis du ikke ser tabellen, må du konvertere den til Delta-format.

Automatisk tabelloppdagelse og -registrering

Den automatiske tabelloppdagelsen og registreringen er en funksjon i Lakehouse som gir en fullstendig administrert fil til tabellopplevelse for dataingeniører og dataforskere. Du kan slippe en fil inn i det administrerte området i Lakehouse, og systemet validerer den automatisk for strukturerte formater som støttes, og registrerer den i metalageret med de nødvendige metadataene, for eksempel kolonnenavn, formater, komprimering og mer. (For øyeblikket er det eneste støttede formatet Delta-tabell.) Deretter kan du referere til filen som en tabell og bruke SparkSQL-syntaks til å samhandle med dataene.

Samhandle med Lakehouse-elementet

En dataingeniør kan samhandle med lakehouse og dataene i lakehouse på flere måter:

The Lakehouse explorer: Utforskeren er den viktigste Lakehouse samhandlingssiden. Du kan laste inn data i Lakehouse, utforske data i Lakehouse ved hjelp av objektutforskeren, angi MIP-etiketter & forskjellige andre ting. Finn ut mer om utforskeropplevelsen: Naviger i Fabric Lakehouse-utforskeren.
Notatblokker: Datateknikere kan bruke notatblokken til å skrive kode for å lese, transformere og skrive direkte til Lakehouse som tabeller og/eller mapper. Du kan lære mer om hvordan du bruker notatblokker for Lakehouse: Utforske dataene i lakehouse med en notatblokk og Slik bruker du en notatblokk til å laste inn data i lakehouse-.
Pipelines: Datateknikere kan bruke dataintegreringsverktøy, for eksempel kopieringsverktøy for datasamlebånd til å hente data fra andre kilder og lande i Lakehouse. Finn mer informasjon om hvordan du bruker kopieringsaktiviteten: Slik kopierer du data ved hjelp av kopieringsaktivitet.
Apache Spark-jobbdefinisjoner: Dataingeniører kan utvikle robuste programmer og organisere utførelsen av kompilerte Spark-jobber i Java, Scala og Python. Finn ut mer om Spark-jobber: Hva er en Apache Spark-jobbdefinisjon?
Dataflyter Gen 2: Datateknikere kan bruke Dataflyter Gen 2 til å innta og klargjøre dataene. Finn mer informasjon om innlasting av data ved hjelp av dataflyter: Opprett din første dataflyt for å hente og transformere data.

Lær mer om de ulike måtene å laste inn data på i lakehouse: Alternativer for å få data inn i Fabric Lakehouse.

Fleroppgavekjøring med lakehouse

Multitasking-opplevelsen gir en nettleserfaneutforming som lar deg åpne og bytte mellom flere elementer sømløst, slik at du kan administrere data lakehouse mer effektivt enn noensinne. Ikke mer sjonglering mellom forskjellige vinduer eller å miste oversikten over oppgavene dine. Lakehouse gir en forbedret fleroppgavekjøringsopplevelse for å gjøre databehandlingsreisen så effektiv og brukervennlig som mulig med følgende funksjoner:

Behold operasjoner som kjører: Du kan laste opp eller kjøre datainnlastingsoperasjon i én fane og kontrollere en annen oppgave i en annen fane. Med forbedret fleroppgaver avbrytes ikke operasjoner som kjører, når du navigerer mellom faner. Du kan fokusere på arbeidet uten avbrudd.
Beholde konteksten: Merkede objekter, datatabeller eller filer forblir åpne og lett tilgjengelige når du bytter mellom faner. Konteksten til data lakehouse er alltid lett tilgjengelig.
ikke-blokkerende listelasting: En ikke-blokkerende innlastingsmekanisme for filer og tabeller-listen. Du kan fortsette å arbeide mens listen oppdateres i bakgrunnen. Det sikrer at du har de nyeste dataene samtidig som du får en jevn og uavbrutt opplevelse.
Klart definerte varsler: Varsler angir hvilket lakehouse de kommer fra, noe som gjør det enklere å spore endringer og oppdateringer i miljøet med flere oppgaver.

Tilgjengelig lakehouse design

Tilgjengelighet har alltid vært en topp prioritet for å sikre at Lakehouse er inkluderende og brukervennlig for alle. Her er de viktigste initiativene vi har implementert så langt for å støtte tilgjengelighet:

skjermleserkompatibilitet: Du kan arbeide sømløst med populære skjermlesere, slik at synshemmede brukere kan navigere og samhandle effektivt med plattformen vår.
tekstflyt responsiv utforming som tilpasser seg ulike skjermstørrelser og retninger. Tekst- og innholdsflyt dynamisk, noe som gjør det enklere for brukere å vise og samhandle med programmet vårt på en rekke enheter.
Tastaturnavigasjon: Forbedret tastaturnavigasjon slik at brukerne kan bevege seg gjennom lakehouse uten å stole på en mus, noe som forbedrer opplevelsen for de med motoriske funksjonshemninger.
Alternativ tekst for bilder: Alle bilder inneholder nå en beskrivende alternativ tekst, noe som gjør det mulig for skjermlesere å formidle meningsfull informasjon.
skjemafelt og etiketter: Alle skjemafelt har tilknyttede etiketter, noe som forenkler datainndata for alle, inkludert de som bruker skjermlesere.

I denne oversikten får du en grunnleggende forståelse av et lakehouse. Gå videre til neste artikkel for å lære hvordan du oppretter og bruker ditt eget lakehouse:

Hvis du vil begynne å bruke lakehouses, kan du se Opprette et lakehouse i Microsoft Fabric.

Del via

Hva er et lakehouse i Microsoft Fabric?

Endepunkt for SQL-analyse i Lakehouse

Automatisk tabelloppdagelse og -registrering

Samhandle med Lakehouse-elementet

Fleroppgavekjøring med lakehouse

Tilgjengelig lakehouse design

Relatert innhold

Tilbakemeldinger

Flere ressurser