OneLake, OneDrive for data
OneLake er en enkel, enhetlig, logisk datainnsjø for hele organisasjonen. I likhet med OneDrive leveres OneLake automatisk med alle Microsoft Fabric-tenanter og er utformet for å være det eneste stedet for alle analysedataene dine. OneLake bringer kunder:
- Én datasjø for hele organisasjonen
- Én kopi av data for bruk med flere analytiske motorer
Viktig
Microsoft Fabric er i forhåndsversjon.
Én datasjø for hele organisasjonen
Før OneLake var det enklere for kundene å opprette flere innsjøer for ulike forretningsgrupper i stedet for å samarbeide på én enkelt innsjø, selv med ekstra kostnader for å administrere flere ressurser. OneLake fokuserer på å fjerne disse utfordringene ved å forbedre samarbeidet. Hver kundeleier har nøyaktig én OneLake. Det kan aldri være mer enn én, og hvis du har Fabric, kan det aldri være null. OneLake klargjøres automatisk med hver Fabric-leier uten ekstra ressurser til å konfigurere eller administrere.
Styres som standard med distribuert eierskap for samarbeid
Konseptet med en leier er en unik fordel med en SaaS-tjeneste. Å vite hvor en kundes organisasjon begynner og slutter, gir en naturlig styrings- og samsvarsgrense, som til syvende og sist er under kontroll av en leieradministrator. Alle data som lander i OneLake styres som standard. Selv om alle data er innenfor grensene som er angitt av leieradministratoren, er det viktig at denne administratoren ikke blir en sentral portvokter som hindrer andre deler av organisasjonen i å bidra til OneLake. Du kan opprette et hvilket som helst antall arbeidsområder i en leier. Arbeidsområder gjør det mulig for ulike deler av organisasjonen å distribuere eierskaps- og tilgangspolicyer. Hvert arbeidsområde er en del av en kapasitet som er knyttet til et bestemt område og faktureres separat.
I et arbeidsområde kan du opprette dataelementer, og alle data i OneLake åpnes via dataelementer. I likhet med hvordan Office lagrer Word-, Excel- og PowerPoint-filer i OneDrive, lagrer Fabric innsjøer, lagre og andre elementer i OneLake. Elementer kan gi skreddersydde opplevelser for hver persona, slik som Spark-utvikleropplevelsen i et lakehouse. Hvis du vil ha mer informasjon om hvordan du kommer i gang med OneLake, kan du se Opprette et lakehouse med OneLake.
Åpne på alle nivåer
OneLake er åpen på alle nivåer. OneLake er bygget oppå Azure Data Lake Storage Gen2, og kan støtte alle typer filer, strukturerte eller ustrukturerte. Alle Fabric-dataelementer som datalagre og lakehouses lagrer dataene automatisk i OneLake i deltaparquet-format. Dette betyr at når en datatekniker laster inn data i et lakehouse ved hjelp av Spark og en SQL-utvikler i et fullstendig transaksjonsdatalager bruker T-SQL til å laste inn data, bidrar alle fortsatt til å bygge den samme datasjøen. Alle tabelldata lagres i OneLake i deltaparquetformat. OneLake støtter de samme ADLS Gen2-API-ene og SDK-ene for å være kompatible med eksisterende ADLS Gen2-programmer, inkludert Azure Databricks. Data i OneLake kan løses som om det var én stor ADLS-lagringskonto for hele organisasjonen. Alle arbeidsområder vises som en beholder i denne lagringskontoen. Ulike dataelementer vises som mapper under disse beholderne.
Hvis du vil ha mer informasjon om API-er og endepunkter, kan du se OneLake-tilgang og API-er. Hvis du vil ha eksempler på OneLake-integreringer med Azure, kan du se artikler om Azure Synapse Analyse, Azure Storage Explorer, Azure Databricks og Azure HDInsight.
OneLake-filutforsker for Windows
OneLake er OneDrive for data. Akkurat som OneDrive kan OneLake-data enkelt utforskes fra Windows ved hjelp av OneLake-filutforskeren for Windows. Direkte i Windows kan du navigere i alle arbeidsområder, dataelementer, enkelt laste opp, laste ned eller endre filer akkurat som du kan gjøre på Office. OneLake-filutforskeren forenkler datainnsjøer som legger dem i hendene på selv ikke-tekniske forretningsbrukere. Hvis du vil ha mer informasjon, kan du se OneLake-filutforsker.
Én kopi av data
OneLake har som mål å gi deg mest mulig verdi av én enkelt kopi av data uten databevegelse eller duplisering. Du trenger ikke lenger å kopiere data bare for å bruke dem med en annen motor eller bryte ned siloer, slik at dataene kan analyseres med andre data.
Med snarveier kan du koble sammen data på tvers av forretningsdomener uten dataflytting
Snarveier gjør det enkelt for organisasjonen å dele data mellom brukere og programmer uten å måtte flytte og duplisere informasjon unødvendig. Når grupper arbeider uavhengig i separate arbeidsområder, kan du kombinere data på tvers av ulike forretningsgrupper og domener i et virtuelt dataprodukt slik at de passer til en brukers spesifikke behov. En snarvei er en referanse til data som er lagret på andre filplasseringer. Disse filplasseringene kan være i samme arbeidsområde eller på tvers av ulike arbeidsområder, i OneLake eller utenfor OneLake i ADLS eller S3. Uansett plassering vises referansen som om filene og mappene lagres lokalt.
Hvis du vil ha mer informasjon om hvordan du bruker snarveier, kan du se OneLake-snarveier.
Én kopi av data med flere analytiske motorer
Selv om programmer kan ha fordeling av lagring og databehandling, er dataene ofte optimalisert for én enkelt motor, noe som gjør det vanskelig å gjenbruke de samme dataene for flere programmer. Med Fabric lagrer de ulike analytiske motorene (T-SQL, Spark, Analysis Services osv.) data i det åpne deltaparquetformatet, slik at du kan bruke de samme dataene på tvers av flere motorer. Det er ikke lenger behov for å kopiere data bare for å bruke dem med en annen motor. Du kan alltid velge den beste motoren for jobben du prøver å gjøre. Tenk deg for eksempel at du har et team av SQL-teknikere som bygger et fullstendig transaksjonsdatalager. De kan bruke T-SQL-motoren og all kraften i T-SQL til å opprette tabeller, transformere og laste inn data til tabeller. Hvis en dataforsker ønsker å bruke disse dataene, trenger de ikke lenger å gå gjennom en spesiell Spark/SQL-driver. Alle data lagres i OneLake i deltaparquet-format. Dataforskere kan bruke den fulle kraften til Spark-motoren og bibliotekene med åpen kildekode direkte over dataene.
Forretningsbrukere kan bygge Power BI-rapporter direkte oppå OneLake ved hjelp av den nye direkte lake-modusen i Analysis Services-motoren. Analysis Services-motoren er det som driver Power BI-datasett og har alltid tilbudt to moduser for tilgang til data, import og direktespørring. Direkte lake-modus gir brukerne all importhastigheten uten å måtte kopiere dataene, og kombinerer det beste fra import og direktespørring. Mer informasjon om direkte innsjø: https://aka.ms/DirectLake.
Eksempeldiagram som viser innlasting av data ved hjelp av Spark, spørring ved hjelp av T-SQL og visning av dataene i en Power BI-rapport.