OneLake, das OneDrive für Daten

OneLake ist ein einzelner, einheitlicher, logischer Data Lake für den gesamten organization. Wie OneDrive wird OneLake automatisch mit jedem Microsoft Fabric-Mandanten bereitgestellt und ist so konzipiert, dass er der einzige Ort für alle Ihre Analysedaten ist. OneLake bringt Kunden:

  • Ein Data Lake für die gesamte organization
  • Eine Kopie der Daten zur Verwendung mit mehreren Analyse-Engines

Wichtig

Microsoft Fabric befindet sich derzeit in der VORSCHAU. Diese Informationen beziehen sich auf eine Vorabversion des Produkts, an der vor der Veröffentlichung noch wesentliche Änderungen vorgenommen werden können. Microsoft übernimmt keine Garantie, weder ausdrücklich noch stillschweigend, für die hier bereitgestellten Informationen.

Ein Data Lake für die gesamte organization

Vor OneLake war es für Kunden einfacher, mehrere Seen für verschiedene Geschäftsgruppen zu erstellen, anstatt an einem einzelnen Lake zusammenzuarbeiten, selbst mit dem zusätzlichen Mehraufwand für die Verwaltung mehrerer Ressourcen. OneLake konzentriert sich darauf, diese Herausforderungen zu beseitigen, indem die Zusammenarbeit verbessert wird. Jeder Kundenmandant verfügt über genau einen OneLake. Es kann nie mehr als eins sein, und wenn Sie Über Fabric verfügen, kann es nie 0 sein. OneLake wird automatisch mit jedem Fabric-Mandanten ohne zusätzliche Ressourcen bereitgestellt, die eingerichtet oder verwaltet werden müssen.

Standardmäßig mit verteiltem Besitz für die Zusammenarbeit gesteuert

Das Konzept eines Mandanten ist ein einzigartiger Vorteil eines SaaS-Diensts. Zu wissen, wo die organization eines Kunden beginnt und endet, bietet eine natürliche Governance- und Compliancegrenze, die letztendlich von einem Mandantenadministrator kontrolliert wird. Alle Daten, die in OneLake landen, werden standardmäßig gesteuert. Obwohl alle Daten innerhalb der vom Mandantenadministrator festgelegten Grenzen liegen, ist es wichtig, dass dieser Administrator nicht zu einem zentralen Gatekeeper wird, der andere Teile des organization daran hindert, zu OneLake beizutragen. Innerhalb eines Mandanten können Sie eine beliebige Anzahl von Arbeitsbereichen erstellen. Arbeitsbereiche ermöglichen es verschiedenen Teilen der organization, Besitz- und Zugriffsrichtlinien zu verteilen. Jeder Arbeitsbereich ist Teil einer Kapazität, die an eine bestimmte Region gebunden ist und separat abgerechnet wird.

Diagramm, das die Funktion und Struktur von OneLake zeigt.

Innerhalb eines Arbeitsbereichs können Sie Datenelemente erstellen, und auf alle Daten in OneLake wird über Datenelemente zugegriffen. Ähnlich wie Office Word-, Excel- und PowerPoint-Dateien in OneDrive speichert, speichert Fabric Lakehouses, Warehouses und andere Elemente in OneLake. Elemente können für jede Persona maßgeschneiderte Erfahrungen bieten, z. B. die Spark-Entwicklerumgebung in einem Lakehouse. Weitere Informationen zu den ersten Schritten mit OneLake finden Sie unter Erstellen eines Lakehouse mit OneLake.

Auf allen Ebenen öffnen

OneLake ist auf allen Ebenen geöffnet. OneLake basiert auf Azure Data Lake Storage Gen2 und kann jede Art von Datei unterstützen, sei es strukturiert oder unstrukturiert. Alle Fabric-Datenelemente wie Data Warehouses und Lakehouses speichern ihre Daten automatisch in OneLake im Delta-Parquet-Format. Wenn also ein Data Engineer Daten mithilfe von Spark in ein Lakehouse lädt und ein SQL-Entwickler in einem vollständig transaktionalen Data Warehouse T-SQL zum Laden von Daten verwendet, trägt jeder weiterhin zum Erstellen desselben Data Lake bei. Alle tabellarischen Daten werden in OneLake im Delta-Parquet-Format gespeichert. OneLake unterstützt dieselben ADLS Gen2-APIs und SDKs, um mit vorhandenen ADLS Gen2-Anwendungen, einschließlich Azure Databricks, kompatibel zu sein. Daten in OneLake können so adressiert werden, als ob es sich um ein großes ADLS-Speicherkonto für die gesamte organization. Jeder Arbeitsbereich wird als Container innerhalb dieses Speicherkontos angezeigt. Unter diesen Containern werden verschiedene Datenelemente als Ordner angezeigt.

Diagramm, das zeigt, wie Sie mit APIs und SDKs auf OneLake-Daten zugreifen können.

Weitere Informationen zu APIs und Endpunkten finden Sie unter OneLake-Zugriff und -APIs. Beispiele für OneLake-Integrationen in Azure finden Sie in den Artikeln Azure Synapse Analytics, Azure Storage-Explorer, Azure Databricks und Azure HDInsight.

OneLake-Datei-Explorer für Windows

OneLake ist das OneDrive für Daten. Genau wie OneDrive können OneLake-Daten problemlos von Windows aus mithilfe des OneLake-Datei-Explorers für Windows untersucht werden. Direkt in Windows können Sie in all Ihren Arbeitsbereichen und Datenelementen navigieren, dateien einfach hochladen, herunterladen oder ändern, genau wie in Office. Der OneLake-Datei-Explorer vereinfacht Data Lakes, die sie selbst nicht technischen Geschäftsbenutzern in die Hände geben. Weitere Informationen finden Sie unter OneLake-Datei-Explorer.

Eine Kopie der Daten

OneLake zielt darauf ab, Ihnen den größtmöglichen Nutzen aus einer einzelnen Kopie von Daten ohne Datenverschiebung oder Duplizierung zu bieten. Sie müssen Daten nicht mehr kopieren, nur um sie mit einer anderen Engine zu verwenden oder Silos aufzuschlüsseln, damit Daten mit anderen Daten analysiert werden können.

Mithilfe von Tastenkombinationen können Sie Daten domänenübergreifend ohne Datenverschiebung verbinden.

Mit Verknüpfungen können Ihre organization Daten problemlos zwischen Benutzern und Anwendungen freigeben, ohne Informationen unnötig verschieben und duplizieren zu müssen. Wenn Teams unabhängig in separaten Arbeitsbereichen arbeiten, können Sie mithilfe von Tastenkombinationen Daten in verschiedenen Geschäftsgruppen und Domänen in einem virtuellen Datenprodukt kombinieren, um die spezifischen Anforderungen eines Benutzers zu erfüllen. Eine Verknüpfung ist ein Verweis auf Daten, die an anderen Dateispeicherorten gespeichert sind. Diese Dateispeicherorte können sich innerhalb desselben Arbeitsbereichs oder in verschiedenen Arbeitsbereichen, in OneLake oder außerhalb von OneLake in ADLS oder S3 befinden. Unabhängig vom Speicherort erscheint der Verweis so, als ob die Dateien und Ordner lokal gespeichert sind.

Diagramm, das zeigt, wie Verknüpfungen Daten über Arbeitsbereiche und Elemente hinweg verbinden.

Weitere Informationen zur Verwendung von Tastenkombinationen finden Sie unter OneLake-Tastenkombinationen.

Eine Kopie von Daten mit mehreren Analyse-Engines

Anwendungen können zwar zwischen Speicher und Computing getrennt sein, die Daten werden jedoch häufig für eine einzelne Engine optimiert, was die Wiederverwendung derselben Daten für mehrere Anwendungen erschwert. Mit Fabric speichern die verschiedenen Analyse-Engines (T-SQL, Spark, Analysis Services usw.) Daten im offenen Delta-Parquet-Format, damit Sie dieselben Daten über mehrere Engines hinweg verwenden können. Es ist nicht mehr erforderlich, Daten zu kopieren, nur um sie mit einer anderen Engine zu verwenden. Sie können immer die beste Engine für den Auftrag auswählen, den Sie ausführen möchten. Angenommen, Sie verfügen über ein Team von SQL-Technikern, die ein Data Warehouse für vollständige Transaktionen erstellen. Sie können die T-SQL-Engine und die gesamte Leistungsfähigkeit von T-SQL verwenden, um Tabellen zu erstellen, zu transformieren und Daten in Tabellen zu laden. Wenn ein Data Scientist diese Daten nutzen möchte, muss er keinen speziellen Spark/SQL-Treiber mehr durchlaufen. Alle Daten werden in OneLake im Delta Parquet-Format gespeichert. Data Scientists können die volle Leistungsfähigkeit der Spark-Engine und ihrer Open-Source-Bibliotheken direkt für die Daten nutzen.

Geschäftsbenutzer können Power BI-Berichte direkt auf OneLake erstellen, indem Sie den neuen Direct Lake-Modus in der Analysis Services-Engine verwenden. Die Analysis Services-Engine unterstützt Power BI-Datasets und bietet seit jeher zwei Modi für den Zugriff auf Daten: Import und direkte Abfragen. Der Direct Lake-Modus bietet Benutzern die gesamte Importgeschwindigkeit, ohne die Daten kopieren zu müssen, und kombiniert das Beste aus Import und direkter Abfrage. Weitere Informationen zu Direct Lake: https://aka.ms/DirectLake.

Diagramm, das zeigt, wie mehrere Elemente und Engines dieselbe Kopie von Daten verwenden.Beispieldiagramm: Laden von Daten mit Spark, Abfragen mithilfe von T-SQL und Anzeigen der Daten in einem Power BI-Bericht.

Nächste Schritte