Freigeben über


OneLake, das OneDrive für Daten

OneLake ist ein einziger, einheitlicher, logischer Data Lake für Ihre gesamte Organisation. Wie OneDrive wird OneLake automatisch mit jedem Microsoft Fabric-Mandanten bereitgestellt und ist als zentraler Ort für alle Ihre Analysedaten konzipiert.

OneLake bietet Kunden Folgendes:

  • Ein Data Lake für die gesamte Organisation
  • Eine Kopie der Daten für die Verwendung mit mehreren Analyse-Engines

Ein Data Lake für die gesamte Organisation

Vor OneLake haben viele Organisationen mehrere Seen für verschiedene Geschäftsgruppen erstellt, was zu zusätzlichem Aufwand für die Verwaltung mehrerer Ressourcen führte. OneLake entfernt diese Herausforderungen, indem die Zusammenarbeit verbessert wird:

  • Jeder Fabric-Mandant erhält automatisch einen OneLake
  • Sie können nicht mehrere OneLakes erstellen oder Ihr OneLake löschen.
  • Keine zusätzlichen Ressourcen zum Bereitstellen oder Verwalten

Diese Einfachheit hilft Ihrer Organisation bei der Zusammenarbeit an einem einzigen, einheitlichen Data Lake.

Standardmäßig mit verteiltem Besitz für die Zusammenarbeit verwaltet

Die höchste Organisations- und Governance-Ebene für Fabric-Daten ist der Mandant. Alle Daten, die in OneLake landen, werden automatisch durch Richtlinien auf Mandantenebene für Sicherheit, Compliance und Datenverwaltung geschützt.

Innerhalb eines Mandanten erfolgt die Zusammenarbeit innerhalb von Arbeitsbereichen. Sie können eine beliebige Anzahl von Arbeitsbereichen erstellen, um Ihre Daten zu organisieren. Arbeitsbereiche ermöglichen es verschiedenen Teilen der Organisation, Besitz- und Zugriffsrichtlinien zu verteilen. Jeder Arbeitsbereich ist Teil einer Kapazität, die an eine bestimmte Region gebunden ist und separat abgerechnet wird.

Schaubild der Funktion und Struktur von OneLake.

In einem Arbeitsbereich erstellen und greifen Sie über Datenelemente auf alle Daten zu. Ähnlich wie Office Word-, Excel- und PowerPoint-Dateien in OneDrive speichert, speichert Fabric Lakehouses, Datenlager und andere Objekte in OneLake. Jeder Elementtyp bietet maßgeschneiderte Erfahrungen für verschiedene Personas, z. B. die Apache Spark-Entwicklererfahrung in einem Lakehouse.

Basiert auf offenen Standards und Formaten

OneLake basiert auf Azure Data Lake Storage (ADLS) Gen2 und unterstützt alle Arten von Dateien, ob strukturiert oder unstrukturiert. Alle Fabric-Datenelemente wie Data Warehouses und Lakehouses speichern ihre Daten automatisch in OneLake im Delta Parquet-Format. Wenn ein*e Data Engineer Daten mit Apache Spark in ein Lakehouse lädt und ein*e SQL-Entwickler*in T-SQL verwendet, um Daten in einem vollständig transaktionsbasierten Data Warehouse zu laden, tragen beide zum selben Data Lake bei. OneLake speichert alle Tabellendaten im Delta-Parquet-Format.

OneLake unterstützt dieselben ADLS Gen2-APIs und -SDKs, um mit vorhandenen ADLS Gen2-Anwendungen, einschließlich Azure Databricks, kompatibel zu sein. Sie können Daten in OneLake so adressieren, als wäre es ein großes ADLS-Speicherkonto für die gesamte Organisation. Jeder Arbeitsbereich wird als Container innerhalb dieses Speicherkontos angezeigt, und unterschiedliche Datenelemente werden als Ordner in diesen Containern angezeigt.

Schaubild, auf dem gezeigt wird, wie Sie auf OneLake-Daten mit APIs und SDKs zugreifen können.

Weitere Informationen zu APIs und Endpunkten finden Sie unter OneLake-Zugriff und -APIs. Beispiele für OneLake-Integrationen mit Azure finden Sie in den Artikeln Azure Synapse Analytics, Azure Storage-Explorer, Azure Databricks und Azure HDInsight.

OneLake-Datei-Explorer für Windows

Sie können OneLake-Daten aus Windows mithilfe des OneLake-Datei-Explorers für Windows erkunden. Sie können in allen Arbeitsbereichen und Datenelementen navigieren, Dateien ganz einfach hochladen, herunterladen oder ändern, genau wie in Office. Der OneLake-Datei-Explorer vereinfacht das Arbeiten mit Data Lakes, sodass sogar nicht technische Geschäftsbenutzer sie verwenden können.

Weitere Informationen finden Sie unter OneLake-Datei-Explorer.

Eine Kopie der Daten

OneLake zielt darauf ab, Ihnen den größtmöglichen Nutzen aus einer einzelnen Kopie von Daten ohne Datenverschiebung oder Duplizierung zu geben. Sie müssen Daten nicht kopieren, nur um sie mit einer anderen Engine zu verwenden oder Daten aus mehreren Quellen zu analysieren.

Verknüpfungen verbinden Daten über Domänen hinweg ohne Datenverschiebung

Eine Verknüpfung ist ein Verweis auf Daten, die an anderen Dateispeicherorten gespeichert sind. Diese Dateispeicherorte können sich innerhalb desselben Arbeitsbereichs oder in verschiedenen Arbeitsbereichen innerhalb von OneLake oder außerhalb von OneLake befinden, z. B. ADLS, S3 oder Dataverse. Unabhängig vom Speicherort führen Verknüpfungen dazu, dass Dateien und Ordner so aussehen, als wären sie lokal gespeichert.

Mit Verknüpfungen kann Ihre Organisation Daten zwischen Benutzern und Anwendungen freigeben, ohne unnötig Informationen verschieben und duplizieren zu müssen. Wenn Teams unabhängig in separaten Arbeitsbereichen arbeiten, können Sie mithilfe von Verknüpfungen Daten in verschiedenen Unternehmensgruppen und Domänen zu einem virtuellen Datenprodukt kombinieren, um die spezifischen Anforderungen eines Benutzers bzw. einer Benutzerin zu erfüllen.

Diagramm, das zeigt, wie Kurzbefehle Daten über Arbeitsbereiche und Elemente hinweg verbinden.

Weitere Informationen zur Verwendung von Verknüpfungen finden Sie unter OneLake-Verknüpfungen.

Verbinden von Daten mit mehreren Analysemodulen

Daten sind häufig für ein einzelnes Modul optimiert, wodurch es schwierig ist, dieselben Daten für mehrere Anwendungen wiederzuverwenden. Mit Fabric speichern die verschiedenen Analysemodule (T-SQL, Apache Spark, Analysis Services und andere) Daten im offenen Delta-Parkettformat, damit Sie dieselben Daten über mehrere Module hinweg verwenden können.

Sie müssen Daten nicht kopieren, um sie mit einer anderen Engine zu verwenden oder sich gezwungen fühlen, eine bestimmte Engine zu verwenden, weil Ihre Daten dort gespeichert sind. Stellen Sie sich z. B. ein Team von SQL-Ingenieuren vor, das ein vollständig transaktionsales Data Warehouse erstellt. Sie können die T-SQL-Engine und die gesamte Leistungsfähigkeit von T-SQL verwenden, um Tabellen zu erstellen, Daten zu transformieren und die Daten in Tabellen zu laden. Wenn ein Datenwissenschaftler diese Daten nutzen möchte, müssen sie keinen speziellen Spark/SQL-Treiber durchlaufen. OneLake speichert alle Daten im Delta-Parquet-Format. Der Data Scientist kann die volle Leistungsfähigkeit des Spark-Moduls und seiner Open-Source-Bibliotheken direkt über die Daten nutzen.

Geschäftsbenutzer können Power BI-Berichte direkt über OneLake mithilfe des Direct Lake-Modus im Analysis Services-Modul erstellen. Das Analysis Services-Modul bietet Power BI-Semantikmodelle und bietet immer zwei Modi für den Zugriff auf Daten: Import und direkte Abfrage. Dieser dritte Modus, Direct Lake-Modus, bietet Benutzern die gesamte Importgeschwindigkeit, ohne die Daten kopieren zu müssen, und kombiniert das Beste aus Import und direkter Abfrage. Weitere Informationen finden Sie unter Direct Lake.

Beispieldiagramm zum Laden von Daten mithilfe von Spark, Abfragen mit T-SQL und Anzeigen der Daten in einem Power BI-Bericht.

Nächste Schritte

Sind Sie bereit für die Verwendung von OneLake? Dies sind die dazu erforderlichen ersten Schritte: