Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of mappen te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen om mappen te wijzigen.
OneLake is één, geïntegreerde, logische Data Lake voor uw hele organisatie. Net als OneDrive wordt OneLake automatisch geleverd met elke Microsoft Fabric-tenant en is ontworpen als de enige plaats voor al uw analysegegevens.
OneLake brengt klanten:
- Eén data lake voor de hele organisatie
- Eén kopie van gegevens voor gebruik met meerdere analytische engines
Eén data lake voor de hele organisatie
Voordat OneLake werd gemaakt, maakten veel organisaties meerdere meren voor verschillende bedrijfsgroepen, wat leidde tot extra overhead voor het beheren van meerdere resources. OneLake verwijdert deze uitdagingen door samenwerking te verbeteren:
- Elke Fabric-tenant krijgt automatisch één OneLake
- U kunt niet meerdere OneLakes maken of uw OneLake verwijderen
- Geen extra middelen om in te richten of te beheren
Deze eenvoud helpt uw organisatie samen te werken aan één, geïntegreerde Data Lake.
Standaard beheerd met gedistribueerd eigendom voor samenwerking
Het hoogste niveau van organisatie en governance voor Fabric-gegevens is de tenant. Alle gegevens die in OneLake terechtkomen, worden automatisch beveiligd door beleid op tenantniveau voor beveiliging, naleving en gegevensbeheer.
Binnen een tenant vindt samenwerking plaats binnen werkruimten. U kunt een willekeurig aantal werkruimten maken om uw gegevens te ordenen. Met werkruimten kunnen verschillende onderdelen van de organisatie eigendom en toegangsbeleid distribueren. Elke werkruimte maakt deel uit van een capaciteit die is gekoppeld aan een specifieke regio en afzonderlijk wordt gefactureerd.
Binnen een werkruimte maakt en opent u alle gegevens via gegevensitems. Net zoals In Office Word-, Excel- en PowerPoint-bestanden worden opgeslagen in OneDrive, slaat Fabric lakehouses, magazijnen en andere items op in OneLake. Elk itemtype biedt op maat gemaakte ervaringen voor verschillende persona's, zoals de Apache Spark-ontwikkelaarservaring in een lakehouse.
Gebouwd op open standaarden en indelingen
OneLake is gebouwd op Azure Data Lake Storage (ADLS) Gen2 en kan elk type bestand, gestructureerd of ongestructureerd ondersteunen. Alle Fabric-gegevensitems, zoals datawarehouses en lakehouses, slaan hun gegevens automatisch op in OneLake in Delta Parquet-indeling. Als een data engineer gegevens in een lakehouse laadt met apache Spark en een SQL-ontwikkelaar T-SQL gebruikt om gegevens in een volledig transactioneel datawarehouse te laden, dragen beide bij aan dezelfde data lake. In OneLake worden alle tabelgegevens opgeslagen in Delta Parquet-indeling.
OneLake ondersteunt dezelfde ADLS Gen2-API's en SDK's die compatibel zijn met bestaande ADLS Gen2-toepassingen, waaronder Azure Databricks. U kunt gegevens in OneLake aanpakken alsof het één groot ADLS-opslagaccount is voor de hele organisatie. Elke werkruimte wordt weergegeven als een container binnen dat opslagaccount en verschillende gegevensitems worden weergegeven als mappen in die containers.
Zie OneLake-toegang en API's voor meer informatie over API's en eindpunten. Zie de artikelen Azure Synapse Analytics, Azure Storage Explorer, Azure Databricks en Azure HDInsight voor voorbeelden van OneLake-integraties met Azure.
OneLake-bestandsverkenner voor Windows
U kunt OneLake-gegevens van Windows verkennen met behulp van de Bestandenverkenner van OneLake voor Windows. U kunt door al uw werkruimten en gegevensitems navigeren, eenvoudig bestanden uploaden, downloaden of wijzigen, net zoals in Office. De Bestandenverkenner van OneLake vereenvoudigt het werken met data lakes, zodat zelfs niet-technische zakelijke gebruikers ze kunnen gebruiken.
Zie OneLake-verkenner voor meer informatie.
Eén kopie van gegevens
OneLake is erop gericht u de meeste waarde te geven van één kopie van gegevens zonder gegevensverplaatsing of duplicatie. U hoeft geen gegevens te kopiëren om deze te gebruiken met een andere engine of om gegevens uit meerdere bronnen te analyseren.
Snelkoppelingen verbinden gegevens tussen domeinen zonder gegevensverplaatsing
Een snelkoppeling is een verwijzing naar gegevens die zijn opgeslagen op andere bestandslocaties. Deze bestandslocaties kunnen zich binnen dezelfde werkruimte of in verschillende werkruimten bevinden, binnen OneLake of buiten OneLake, zoals ADLS, S3 of Dataverse. Snelkoppelingen maken bestanden en mappen, ongeacht de locatie, alsof ze lokaal zijn opgeslagen.
Met snelkoppelingen kan uw organisatie gegevens delen tussen gebruikers en toepassingen zonder dat u gegevens onnodig hoeft te verplaatsen en dupliceren. Wanneer teams onafhankelijk werken in afzonderlijke werkruimten, kunt u met snelkoppelingen gegevens in verschillende bedrijfsgroepen en domeinen combineren in een virtueel gegevensproduct om aan de specifieke behoeften van een gebruiker te voldoen.
Zie OneLake-snelkoppelingen voor meer informatie over het gebruik van sneltoetsen.
Gegevens verbinden met meerdere analytische engines
Gegevens worden vaak geoptimaliseerd voor één engine, waardoor het moeilijk is om dezelfde gegevens voor meerdere toepassingen opnieuw te gebruiken. Met Fabric slaan de verschillende analytische engines (T-SQL, Apache Spark, Analysis Services en andere) gegevens op in de open Delta Parquet-indeling, zodat u dezelfde gegevens in meerdere engines kunt gebruiken.
U hoeft geen gegevens alleen te kopiëren om deze te gebruiken met een andere engine of als u vastloopt met het gebruik van een bepaalde engine, omdat daar uw gegevens zich bevinden. Stel dat een team van SQL-technici een volledig transactioneel datawarehouse bouwt. Ze kunnen de T-SQL-engine en alle kracht van T-SQL gebruiken om tabellen te maken, gegevens te transformeren en de gegevens in tabellen te laden. Als een data scientist gebruik wil maken van deze gegevens, hoeven ze geen speciaal Spark/SQL-stuurprogramma te doorlopen. In OneLake worden alle gegevens opgeslagen in Delta Parquet-indeling. De data scientist kan de volledige kracht van de Spark-engine en de opensource-bibliotheken rechtstreeks over de gegevens gebruiken.
Zakelijke gebruikers kunnen Power BI-rapporten rechtstreeks op OneLake bouwen met behulp van de Direct Lake-modus in de Analysis Services-engine. De Analysis Services-engine zorgt voor semantische Power BI-modellen en biedt altijd twee modi voor toegang tot gegevens: importeren en directe query's. Deze derde modus, de Direct Lake-modus, biedt gebruikers alle snelheid van importeren zonder dat ze de gegevens hoeven te kopiëren, waarbij het beste van importeren en directe query's worden gecombineerd. Zie Direct Lake voor meer informatie.
Volgende stappen
Klaar om OneLake te gaan gebruiken? U gaat als volgt aan de slag: