OneLake, OneDrive for data

OneLake er en enkelt samlet, logisk datasø for hele organisationen. På samme måde som OneDrive følger OneLake automatisk med alle Microsoft Fabric-lejere og er designet til at være det eneste sted for alle dine analysedata. OneLake bringer kunder:

  • Én datasø for hele organisationen
  • Én kopi af data til brug med flere analyseprogrammer

Vigtigt

Microsoft Fabric findes i øjeblikket i PRØVEVERSION. Disse oplysninger er relateret til et foreløbig produkt, der kan blive ændret væsentligt, før det udgives. Microsoft giver ingen garantier, udtrykt eller stiltiende, med hensyn til de oplysninger, der er angivet her.

Én datasø for hele organisationen

Før OneLake var det nemmere for kunderne at oprette flere søer til forskellige forretningsgrupper i stedet for at samarbejde på en enkelt sø, selv med den ekstra belastning, det var at administrere flere ressourcer. OneLake fokuserer på at fjerne disse udfordringer ved at forbedre samarbejdet. Hver kundelejer har præcis én OneLake. Der kan aldrig være mere end én, og hvis du har Fabric, kan der aldrig være nul. OneLake klargøres automatisk med hver Fabric-lejer uden ekstra ressourcer at konfigurere eller administrere.

Styret som standard med distribueret ejerskab til samarbejde

Begrebet lejer er en unik fordel ved en SaaS-tjeneste. Når du ved, hvor en kundes organisation starter og slutter, får du en naturlig grænse for styring og overholdelse af angivne standarder, som i sidste ende styres af en lejeradministrator. Alle data, der lander i OneLake, styres som standard. Selvom alle data er inden for de grænser, der er angivet af lejeradministratoren, er det vigtigt, at denne administrator ikke bliver en central dørvogter, der forhindrer andre dele af organisationen i at bidrage til OneLake. I en lejer kan du oprette et vilkårligt antal arbejdsområder. Arbejdsområder gør det muligt for forskellige dele af organisationen at distribuere ejerskabs- og adgangspolitikker. Hvert arbejdsområde er en del af en kapacitet, der er knyttet til et bestemt område, og som faktureres separat.

Diagram, der viser funktionen og strukturen af OneLake.

I et arbejdsområde kan du oprette dataelementer, og alle data i OneLake tilgås via dataelementer. På samme måde som Office-butikker Word-, Excel- og PowerPoint-filer i OneDrive, gemmer Fabric lakehouses, lagre og andre elementer i OneLake. Elementer kan give skræddersyede oplevelser for hver person, f.eks. Spark-udvikleroplevelsen i et lakehouse. Du kan finde flere oplysninger om, hvordan du kommer i gang med at bruge OneLake, under Oprettelse af et lakehouse med OneLake.

Åbn på alle niveauer

OneLake er åben på alle niveauer. OneLake, der er bygget oven på Azure Data Lake Storage Gen2, kan understøtte alle typer filer, strukturerede eller ustrukturerede. Alle Fabric-dataelementer som data warehouses og lakehouses gemmer automatisk deres data i OneLake i delta-parquetformat. Det betyder, at når en datatekniker indlæser data i et lakehouse ved hjælp af Spark, og en SQL-udvikler i et fuldt transaktionsdata warehouse bruger T-SQL til at indlæse data, bidrager alle stadig til at bygge den samme datasø. Alle tabeldata gemmes i OneLake i delta-parquetformat. OneLake understøtter de samme ADLS Gen2-API'er og SDK'er for at være kompatible med eksisterende ADLS Gen2-programmer, herunder Azure Databricks. Data i OneLake kan håndteres, som om det var én stor ADLS-lagerkonto for hele organisationen. Hvert arbejdsområde vises som en objektbeholder i den pågældende lagerkonto. Forskellige dataelementer vises som mapper under disse objektbeholdere.

Diagram, der viser, hvordan du kan få adgang til OneLake-data med API'er og SDK'er.

Du kan finde flere oplysninger om API'er og slutpunkter i OneLake-adgang og API'er. Du kan finde eksempler på OneLake-integrationer med Azure i artiklerne Azure Synapse Analytics, Azure Storage Explorer, Azure Databricks og Azure HDInsight.

OneLake-stifinder til Windows

OneLake er OneDrive for-dataene. På samme måde som OneDrive kan OneLake-data nemt udforskes fra Windows ved hjælp af OneLake-stifinder til Windows. Direkte i Windows kan du navigere i alle dine arbejdsområder, dataelementer, nemt uploade, downloade eller redigere filer på samme måde som på Office. OneLake-stifinder forenkler datasøer og giver dem til selv ikke-tekniske forretningsbrugere. Du kan finde flere oplysninger i OneLake-stifinder.

Én kopi af data

OneLake har til formål at give dig den størst mulige værdi ud af en enkelt kopi af data uden dataflytning eller duplikering. Du behøver ikke længere at kopiere data blot for at bruge dem med et andet program eller for at opdele siloer, så dataene kan analyseres med andre data.

Genveje giver dig mulighed for at forbinde data på tværs af forretningsdomæner uden dataflytning

Genveje gør det nemt for din organisation at dele data mellem brugere og programmer, uden at det er unødvendigt at flytte og duplikere oplysninger. Når teams arbejder uafhængigt af hinanden i separate arbejdsområder, giver genveje dig mulighed for at kombinere data på tværs af forskellige forretningsgrupper og domæner i et virtuelt dataprodukt, så det passer til en brugers specifikke behov. En genvej er en reference til data, der er gemt på andre filplaceringer. Disse filplaceringer kan være inden for det samme arbejdsområde eller på tværs af forskellige arbejdsområder, i OneLake eller uden for OneLake i ADLS eller S3. Uanset placeringen vises referencen, som om filerne og mapperne er gemt lokalt.

Diagram, der viser, hvordan genveje forbinder data på tværs af arbejdsområder og elementer.

Du kan finde flere oplysninger om, hvordan du bruger genveje, i OneLake-genveje.

Én kopi af data med flere analyseprogrammer

Selvom programmer kan adskille lagring og databehandling, er dataene ofte optimeret til et enkelt program, hvilket gør det svært at genbruge de samme data til flere programmer. Med Fabric gemmer de forskellige analyseprogrammer (T-SQL, Spark, Analysis Services osv.) data i det åbne delta-parquetformat, så du kan bruge de samme data på tværs af flere motorer. Det er ikke længere nødvendigt at kopiere data blot for at bruge dem sammen med et andet program. Du kan altid vælge det bedste program til det job, du forsøger at udføre. Forestil dig f.eks., at du har et team af SQL-teknikere, der bygger et fuldt transaktionsdata warehouse. De kan bruge T-SQL-programmet og al kraften i T-SQL til at oprette tabeller, transformere og indlæse data i tabeller. Hvis en dataspecialist ønsker at gøre brug af disse data, behøver de ikke længere at gennemgå en særlig Spark/SQL-driver. Alle data gemmes i OneLake i delta-parquetformat. Datateknikere kan bruge den fulde styrke af Spark-programmet og dets biblioteker med åben kildekode direkte over dataene.

Virksomhedsbrugere kan oprette Power BI-rapporter direkte oven på OneLake ved hjælp af den nye direkte lake-tilstand i Analysis Services-programmet. Analysis Services-programmet styrer Power BI-datasæt og har altid tilbudt to måder at få adgang til data, import og direkte forespørgsler på. Direct lake-tilstand giver brugerne al den hastighed, de importerer uden at skulle kopiere dataene, og kombinerer det bedste fra import og direkte forespørgsler. Få mere at vide om direct lake: https://aka.ms/DirectLake.

Diagram, der viser, hvordan flere elementer og programmer bruger den samme kopi af data.Eksempeldiagram, der viser indlæsning af data ved hjælp af Spark, forespørgsel ved hjælp af T-SQL og visning af dataene i en Power BI-rapport.

Næste trin