Teilen über


Verfügbarkeit von Eventhouse OneLake

Sie können eine einzige logische Kopie der KQL-Datenbankdaten in einem Eventhouse erstellen, indem Sie die OneLake-Verfügbarkeit aktivieren. Die Aktivierung der OneLake-Verfügbarkeit bedeutet, dass Sie die Daten in Ihrer KQL-Datenbank im Delta Lake-Format über andere Fabric-Engines wie den Direct Lake-Modus in Power BI, Warehouse, Lakehouse, Notebooks usw. abfragen können.

Delta Lake ist ein einheitliches Data Lake-Tabellenformat, das einen nahtlosen Datenzugriff über alle Compute Engines in Microsoft Fabric ermöglicht. Weitere Informationen zu Delta Lake finden Sie unter Was ist Delta Lake?.

In diesem Artikel erfahren Sie, wie Sie die Verfügbarkeit von KQL-Datenbankdaten in OneLake aktivieren.

Funktionsweise

Die folgende Tabelle beschreibt das Verhalten Ihrer KQL-Datenbank und -Tabellen, wenn Sie die Verfügbarkeit von OneLake ein- oder ausschalten.

Aktiviert Ausgeschaltet
KQL-Datenbank – Vorhandene Tabellen sind nicht betroffen. Neue Tabellen werden in OneLake zur Verfügung gestellt.
– Die Datenaufbewahrungsrichtlinie Ihrer KQL-Datenbank wird auch auf die Daten in OneLake angewandt. Daten, die am Ende des Aufbewahrungszeitraums aus Ihrer KQL-Datenbank entfernt werden, werden auch aus OneLake entfernt.
– Vorhandene Tabellen sind nicht betroffen. Neue Tabellen sind nicht in OneLake verfügbar.
Eine Tabelle in der KQL-Datenbank – Neue Daten werden in OneLake zur Verfügung gestellt.
– Vorhandene Daten werden nicht abgeglichen.
– Daten können nicht gelöscht, abgeschnitten oder endgültig gelöscht werden.
– Das Tabellenschema kann nicht geändert werden, und die Tabelle kann nicht umbenannt werden.
– Neue Daten werden in OneLake nicht zur Verfügung gestellt.
– Daten können gelöscht, abgeschnitten oder gelöscht werden.
– Das Tabellenschema kann nicht geändert werden, und die Tabelle kann nicht umbenannt werden.
– Daten werden vorläufig aus OneLake gelöscht.

Wichtig

Es kann einige Stunden dauern, bis die Daten in OneLake angezeigt werden. Weitere Informationen finden Sie unter Adaptives Verhalten.

Für die Verfügbarkeit von OneLake fallen keine zusätzlichen Speicherkosten an. Weitere Informationen finden Sie unter Ressourcenverbrauch.

Voraussetzungen

Aktivieren der OneLake-Verfügbarkeit

Sie können die Verfügbarkeit von OneLake entweder auf KQL-Datenbank- oder auf Tabellenebene aktivieren.

  1. Um die OneLake-Verfügbarkeit zu aktivieren, gehen Sie auf die Detailseite Ihrer KQL-Datenbank oder -Tabelle.

  2. Wählen Sie neben OneLake-Verfügbarkeit im Bereich Datenbankdetails die Option Bearbeiten (Stiftsymbol) aus.

    Screenshot: Bereich Datenbankdetails der Real-Time Intelligence mit einer Übersicht der Datenbank und der hervorgehobenen Bearbeitungsoption für die OneLake-Verfügbarkeit.

  3. Aktivieren Sie das Feature, indem Sie die Schaltfläche auf Aktiv umschalten, und wählen Sie dann Fertig aus. Die Datenbank wird automatisch aktualisiert.

    Screenshot: Fenster mit Details zum OneLake-Ordner in der Real-Time Intelligence in Microsoft Fabric. Die Option, um Daten in OneLake verfügbar zu machen, ist aktiviert.

Sie haben die OneLake-Verfügbarkeit in Ihrer KQL-Datenbank aktiviert. Sie können jetzt auf alle neuen Daten zugreifen, die Ihrer Datenbank im angegebenen OneLake-Pfad im Delta Lake-Format hinzugefügt wurden. Sie können außerdem eine OneLake-Verknüpfung aus einem Lakehouse oder Data Warehouse erstellen oder die Daten direkt über den Power BI Direct Lake-Modus abfragen.

Adaptives Verhalten

Eventhouse verfügt über einen stabilen Mechanismus, der eingehende Streams intelligent mittels Batchverarbeitung in eine oder mehrere für die Analyse strukturierte Parquet-Dateien überführt. Die Batchverarbeitung von Streams ist wichtig beim Umgang mit nach und nach eingehenden Daten. Das Schreiben vieler kleiner Parquet-Dateien in den Lake kann ineffizient sein, was höhere Kosten und eine schlechte Leistung zur Folge hat.

Der adaptive Mechanismus von Eventhouse kann Schreibvorgänge um einige Stunden verzögern, wenn zum Erstellen optimaler Parquet-Dateien nicht genügend Daten vorhanden sind. Dadurch wird sichergestellt, dass Parquet-Dateien eine optimale Größe haben und den bewährten Methoden für Delta Lake entsprechen. Der adaptive Mechanismus von Eventhouse stellt sicher, dass die Parquet-Dateien für die Analyse gerüstet sind, und stimmt die Notwendigkeit einer zeitnahen Datenverfügbarkeit mit Kosten- und Leistungsüberlegungen ab.

Sie können überwachen, wie lange es her ist, dass neue Daten in den Lake hinzugefügt wurden, indem Sie die Datenlatenz mit dem Befehl .show table mirroring operations überprüfen.

Die Ergebnisse werden ab dem letzten Hinzufügen von Daten gemessen. Wenn sich eine Latenz von 00:00:00 ergibt, sind alle Daten in der KQL-Datenbank in OneLake verfügbar.

Dateien anzeigen

Wenn Sie die OneLake-Verfügbarkeit für eine Tabelle aktivieren, wird ein Delta-Protokollordner zusammen mit allen entsprechenden JSON- und Parquet-Dateien erstellt. Sie können die Dateien, die in OneLake verfügbar gemacht wurden, und ihre Eigenschaften anzeigen, während Sie sich weiterhin in der Real-Time Intelligence befinden.

  • Um die Dateien anzuzeigen, zeigen Sie im Explorer-Bereich auf eine Tabelle, und wählen Sie dann das Menü „Mehr“ [...]>Dateien anzeigen aus.

    Screenshot des Explorer-Fensters, das das Dropdown-Menü Weitere einer Tabelle zeigt.

  • Um die Eigenschaften des Delta-Protokoll-Ordners oder der einzelnen Dateien anzuzeigen, bewegen Sie den Mauszeiger über den Ordner oder die Datei und wählen Sie dann das Menü "Weitere" [...]>Eigenschaften aus.

  • So zeigen Sie die Dateien im Delta-Protokoll-Ordner an:

    1. Wählen Sie den Ordner _delta_log aus.
    2. Wählen Sie eine Datei aus, um die Metadaten und das Schema der Tabelle anzuzeigen. Der Editor, der geöffnet wird, ist im schreibgeschützten Format.

Zugriffsspiegelungsrichtlinie

Beim Einschalten der OneLake-Verfügbarkeit wird standardmäßig eine Spiegelungsrichtlinie aktiviert. Sie können die Richtlinie zum Überwachen der Datenlatenz nutzen oder zum Partitionieren von Deltatabellen ändern.

Hinweis

Wenn Sie die OneLake-Verfügbarkeit ausschalten, wird die Eigenschaft IsEnabled der Spiegelungsrichtlinie auf false (IsEnabled=false) gesetzt.

Partitionieren von Delta-Tabellen

Sie können Ihre Delta-Tabellen partitionieren, um die Abfragegeschwindigkeit zu verbessern. Informationen dazu, wann Ihre OneLake-Dateien partitioniert werden sollten, finden Sie unter Gründe für die Partitionierung von Tabellen. Jede Partition wird anhand des in der Partitionsliste aufgeführten PartitionName als separate Spalte dargestellt. Dies bedeutet, dass Ihre OneLake-Kopie mehr Spalten hat als die Quelltabelle.

Verwenden zum Partitionieren Ihrer Delta-Tabellen den Befehl .alter-merge table policy mirroring.