Del via


OneLake, OneDrive for data

OneLake er en enkelt, samlet og logisk datasø for hele organisationen. En data Lake behandler store mængder data fra forskellige kilder. På samme måde som OneDrive følger OneLake automatisk med alle Microsoft Fabric-lejere og er designet til at være det eneste sted for alle dine analysedata. OneLake bringer kunder:

  • Én datasø for hele organisationen
  • Én kopi af data til brug sammen med flere analyseprogrammer

Én datasø for hele organisationen

Før OneLake var det nemmere for kunderne at oprette flere søer til forskellige forretningsgrupper i stedet for at samarbejde på en enkelt sø, selv med den ekstra belastning ved at administrere flere ressourcer. OneLake fokuserer på at fjerne disse udfordringer ved at forbedre samarbejdet. Hver kundelejer har præcis én OneLake. Der kan aldrig være mere end én, og hvis du har Fabric, kan der aldrig være nul. Hver Fabric-lejer klargør automatisk OneLake uden ekstra ressourcer, der skal konfigureres eller administreres.

Styret som standard med distribueret ejerskab til samarbejde

Begrebet lejer er en unik fordel ved en SaaS-tjeneste. At vide, hvor en kundes organisation starter og slutter, giver en naturlig styrings- og overholdelsesgrænse, som er under kontrol af en lejeradministrator. Alle data, der lander i OneLake, er underlagt som standard. Selvom alle data er inden for de grænser, der er angivet af lejeradministratoren, er det vigtigt, at denne administrator ikke bliver en central portvogter, der forhindrer andre dele af organisationen i at bidrage til OneLake.

I en lejer kan du oprette et vilkårligt antal arbejdsområder. Arbejdsområder gør det muligt for forskellige dele af organisationen at distribuere ejerskabs- og adgangspolitikker. Hvert arbejdsområde er en del af en kapacitet, der er knyttet til et bestemt område og faktureres separat.

Diagram, der viser funktionen og strukturen af OneLake.

I et arbejdsområde kan du oprette dataelementer, og du kan få adgang til alle data i OneLake via dataelementer. På samme måde som Office gemmer Word-, Excel- og PowerPoint-filer i OneDrive, gemmer Fabric lakehouses, lagre og andre elementer i OneLake. Elementer kan give skræddersyede oplevelser for hver person, f.eks Apache Spark-udvikleroplevelsen i et lakehouse.

Du kan få flere oplysninger om, hvordan du kommer i gang med at bruge OneLake, under Oprettelse af et lakehouse med OneLake.

Åbn på hvert niveau

OneLake er åben på alle niveauer. OneLake er bygget oven på Azure Data Lake Storage (ADLS) Gen2 og kan understøtte alle typer filer, strukturerede eller ustrukturerede. Alle Fabric-dataelementer som data warehouses og lakehouses gemmer automatisk deres data i OneLake i Delta Parquet-format. Hvis en datatekniker indlæser data i et lakehouse ved hjælp af Apache Spark, og en SQL-udvikler derefter bruger T-SQL til at indlæse data i et fuldt transaktionsdata warehouse, bidrager begge til den samme datasø. OneLake gemmer alle tabeldata i Delta Parquet-format.

OneLake understøtter de samme ADLS Gen2-API'er og SDK'er for at være kompatible med eksisterende ADLS Gen2-programmer, herunder Azure Databricks. Du kan adressere data i OneLake, som om det er én stor ADLS-lagerkonto for hele organisationen. Hvert arbejdsområde vises som en objektbeholder i den pågældende lagerkonto, og forskellige dataelementer vises som mapper i disse objektbeholdere.

Diagram, der viser, hvordan du kan få adgang til OneLake-data med API'er og SDK'er.

Du kan finde flere oplysninger om API'er og slutpunkter under OneLake-adgang og API'er. Du kan se eksempler på OneLake-integrationer med Azure i artikler om Azure Synapse Analytics, Azure Storage Explorer, Azure Databricks og Azure HDInsight .

OneLake-stifinder til Windows

OneLake er OneDrive for data. På samme måde som Med OneDrive kan du nemt udforske OneLake-data fra Windows ved hjælp af OneLake-stifinderen til Windows. Du kan navigere i alle dine arbejdsområder og dataelementer, nemt uploade, downloade eller redigere filer på samme måde som i Office. OneLake-stifinderen forenkler arbejdet med datasøer, så selv ikke-tekniske erhvervsbrugere kan bruge dem.

Du kan få flere oplysninger i OneLake-stifinder.

Én kopi af data

OneLake har til formål at give dig den størst mulige værdi ud af en enkelt kopi af data uden dataflytning eller duplikering. Du behøver ikke længere at kopiere data bare for at bruge dem med et andet program eller for at opdele siloer, så du kan analysere dataene med data fra andre kilder.

Genveje forbinder data på tværs af domæner uden dataflytning

Genveje gør det nemt for din organisation at dele data mellem brugere og programmer uden at skulle flytte og duplikere oplysninger unødigt. Når teams arbejder uafhængigt af hinanden i separate arbejdsområder, kan du bruge genveje til at kombinere data på tværs af forskellige forretningsgrupper og domæner i et virtuelt dataprodukt, så de passer til en brugers specifikke behov.

En genvej er en reference til data, der er gemt på andre filplaceringer. Disse filplaceringer kan være inden for det samme arbejdsområde eller på tværs af forskellige arbejdsområder, i OneLake eller uden for OneLake i ADLS, S3 eller Dataverse – og der kommer snart flere målplaceringer. Uanset placeringen får genveje filer og mapper til at se ud, som om de er gemt lokalt.

Diagram, der viser, hvordan genveje forbinder data på tværs af arbejdsområder og elementer.

Du kan få flere oplysninger om, hvordan du bruger genveje, under OneLake-genveje.

Én kopi af data med flere analyseprogrammer

Selvom programmer kan adskille lagring og databehandling, er dataene ofte optimeret til et enkelt program, hvilket gør det svært at genbruge de samme data til flere programmer. Med Fabric gemmer de forskellige analyseprogrammer (T-SQL, Apache Spark, Analysis Services osv.) data i det åbne Delta Parquet-format, så du kan bruge de samme data på tværs af flere motorer.

Der er ikke længere behov for at kopiere data bare for at bruge dem sammen med et andet program. Du kan altid vælge det bedste program til det job, du forsøger at udføre. Forestil dig f.eks., at du har et team af SQL-teknikere, der bygger et fuldt transaktionsdata warehouse. De kan bruge T-SQL-programmet og al kraften i T-SQL til at oprette tabeller, transformere data og indlæse dataene i tabeller. Hvis en dataspecialist vil bruge disse data, behøver de ikke længere at gennemgå en særlig Spark/SQL-driver. OneLake gemmer alle data i Delta Parquet-format. Datateknikere kan bruge spark-programmet og dets biblioteker med åben kildekode direkte over dataene.

Erhvervsbrugere kan bygge Power BI-rapporter direkte oven på OneLake ved hjælp af den nye Direct Lake-tilstand i Analysis Services-programmet. Analysis Services-programmet styrer semantiske Power BI-modeller, og det har altid tilbudt to måder at få adgang til data på: import og direkte forespørgsler. Direct Lake-tilstand giver brugerne al den hastighed, de importerer uden at skulle kopiere dataene, og kombinerer det bedste ved import og direkte forespørgsler. Du kan få flere oplysninger under Direct Lake.

Diagram, der viser, hvordan flere elementer og programmer bruger den samme kopi af data.

Eksempeldiagram, der viser indlæsning af data ved hjælp af Spark, forespørgsel ved hjælp af T-SQL og visning af dataene i en Power BI-rapport.