Lakehouse- und Delta Lake-Tabellen

2025-06-12

Microsoft Fabric Lakehouse ist eine Datenarchitekturplattform zum Speichern, Verwalten und Analysieren strukturierter und unstrukturierter Daten an einem einzelnen Speicherort. Um einen nahtlosen Datenzugriff über alle Compute-Engines in Microsoft Fabric zu erreichen, wird Delta Lake als einheitliches Tabellenformat ausgewählt.

Wenn Sie Daten in einem Seehaus mithilfe von Funktionen wie Load to Table oder Methoden speichern, die unter "Optionen" beschrieben sind, um Daten in das Fabric Lakehouse zu übertragen, werden alle Daten im Delta-Format gespeichert.

Eine umfassendere Einführung in das Tabellenformat Delta Lake finden Sie auf den Links zu verwandten Inhalten am Ende dieses Artikels.

Big Data-, Apache Spark- und Legacytabellenformate

Microsoft Fabric Runtime für Apache Spark verwendet dieselbe Grundlage wie Azure Synapse Analytics Runtime für Apache Spark, enthält aber wichtige Unterschiede, um ein optimiertes Verhalten für alle Module im Microsoft Fabric-Dienst bereitzustellen. In Microsoft Fabric sind die wichtigsten Leistungsfeatures standardmäßig aktiviert. Fortgeschrittene Apache Spark-Benutzer*innen können Konfigurationen auf frühere Werte zurücksetzen, um sie besser an bestimmte Szenarios auszurichten.

Microsoft Fabric Lakehouse und die Apache Spark-Engine unterstützen alle Tabellentypen, sowohl verwaltet als auch nicht verwaltet. Dies umfasst Ansichten und reguläre Nicht-Delta Hive-Tabellenformate. Tabellen, die mit PARQUET, CSV, AVRO, JSON und jedem Apache Hive-kompatiblen Dateiformat definiert sind, funktionieren wie erwartet.

Die Benutzeroberfläche des Lakehouse-Explorers variiert je nach Tabellentyp. Derzeit rendert der Lakehouse-Explorer nur Tabellenobjekte.

Konfigurationsunterschiede mit Azure Synapse Analytics

Die folgende Tabelle enthält die Konfigurationsunterschiede zwischen Azure Synapse Analytics und Microsoft Fabric Runtime für Apache Spark.

Apache Spark-Konfiguration	Microsoft Fabric-Wert	Azure Synapse Analytics-Wert	Hinweise
spark.sql.sources.default	Delta	Parkett	Standardtabellenformat
spark.sql.parquet.vorder.default	Wahr	–	Writer für V-Order
spark.sql.parquet.vorder.dictionaryPageSize	2 GB	–	Größenlimit für Wörterbuchseiten für V-Order
spark.databricks.delta.optimizeWrite.enabled	Wahr	Nicht festgelegt (false)	Schreibvorgang optimieren

Automatische Erkennung von Tabellen

Der Lakehouse-Explorer bietet eine baumartige Ansicht der Objekten im Microsoft Fabric Lakehouse-Element. Er verfügt über eine wichtige Funktion zum Ermitteln und Anzeigen von Tabellen, die im Metadatenrepository und im OneLake-Speicher beschrieben werden. Die Tabellenverweise werden im Abschnitt Tables der Benutzeroberfläche des Lakehouse-Explorers angezeigt. Die AutoErmittlung gilt auch für Tabellen, die über OneLake-Verknüpfungen definiert sind.

Tabellen über Verknüpfungen

Microsoft Fabric Lakehouse unterstützt Tabellen, die über OneLake-Verknüpfungen definiert sind, um größtmögliche Kompatibilität und keine Datenverschiebung zu gewährleisten. Die folgende Tabelle enthält die bewährten Szenariomethoden für jeden Elementtyp, wenn er über Verknüpfungen verwendet wird.

Verknüpfungsziel	Wo die Verknüpfung erstellt wird	Bewährte Vorgehensweise
Delta Lake-Tabelle	`Tables` Abschnitt	Wenn mehrere Tabellen im Ziel vorhanden sind, erstellen Sie eine Verknüpfung pro Tabelle.
Ordner mit Dateien	`Files` Abschnitt	Verwenden Sie Apache Spark, um das Ziel direkt mithilfe relativer Pfade zu verwenden. Laden Sie die Daten in Lakehouse-native Delta-Tabellen, um maximale Leistung zu erzielen.
Apache Hive-Legacytabellen	`Files` Abschnitt	Verwenden Sie Apache Spark, um das Ziel direkt mithilfe relativer Pfade zu verwenden, oder erstellen Sie mithilfe der `CREATE EXTERNAL TABLE`-Syntax einen Metadatenkatalogverweis. Laden Sie die Daten in Lakehouse-native Delta-Tabellen, um maximale Leistung zu erzielen.

In Tabelle laden

Microsoft Fabric Lakehouse bietet eine komfortable und produktive Benutzeroberfläche, um das Laden von Daten in Delta-Tabellen zu optimieren. Die Funktion „In Tabelle laden“ ermöglicht ein visuelles Erlebnis beim Laden gängiger Dateiformate in Delta, um die analytische Produktivität für alle Benutzerprofile zu steigern. Weitere Informationen zur Funktion "In Tabelle laden" finden Sie in der Referenzdokumentation zu Delta Lake-Tabellen .

Delta Lake-Tabellenoptimierung

Die Tabellen in Form zu halten für die breite Palette von Analyseszenarien ist keine geringe Herausforderung. Microsoft Fabric Lakehouse ermöglicht proaktiv die wichtigen Parameter, um häufige Probleme im Zusammenhang mit Big Data-Tabellen wie Komprimierung und kleinen Dateigrößen zu minimieren und die Abfrageleistung zu maximieren. Dennoch gibt es viele Szenarios, in denen diese Parameter geändert werden müssen. Der Artikel Optimierung und V-Order für Delta Lake-Tabellen behandelt einige wichtige Szenarios und bietet eine ausführliche Anleitung zur effizienten Verwaltung von Delta-Tabellen für maximale Leistung.

Freigeben über