Verfügbarkeit von Eventhouse OneLake
Sie können eine einzige logische Kopie der KQL-Datenbankdaten in einem Eventhouse erstellen, indem Sie die OneLake-Verfügbarkeit aktivieren. Die Aktivierung der OneLake-Verfügbarkeit bedeutet, dass Sie die Daten in Ihrer KQL-Datenbank im Delta Lake-Format über andere Fabric-Engines wie den Direct Lake-Modus in Power BI, Warehouse, Lakehouse, Notebooks usw. abfragen können.
Delta Lake ist ein einheitliches Data Lake-Tabellenformat, das einen nahtlosen Datenzugriff über alle Compute Engines in Microsoft Fabric ermöglicht. Weitere Informationen zu Delta Lake finden Sie unter Was ist Delta Lake?.
In diesem Artikel erfahren Sie, wie Sie die Verfügbarkeit von KQL-Datenbankdaten in OneLake aktivieren.
Funktionsweise
Die folgende Tabelle beschreibt das Verhalten Ihrer KQL-Datenbank und -Tabellen, wenn Sie die Verfügbarkeit von OneLake ein- oder ausschalten.
Aktiviert | Ausgeschaltet | |
---|---|---|
KQL-Datenbank | – Vorhandene Tabellen sind nicht betroffen. Neue Tabellen werden in OneLake zur Verfügung gestellt. – Die Datenaufbewahrungsrichtlinie Ihrer KQL-Datenbank wird auch auf die Daten in OneLake angewandt. Daten, die am Ende des Aufbewahrungszeitraums aus Ihrer KQL-Datenbank entfernt werden, werden auch aus OneLake entfernt. |
– Vorhandene Tabellen sind nicht betroffen. Neue Tabellen sind nicht in OneLake verfügbar. |
Eine Tabelle in der KQL-Datenbank | – Neue Daten werden in OneLake zur Verfügung gestellt. – Vorhandene Daten werden nicht abgeglichen. – Daten können nicht gelöscht, abgeschnitten oder endgültig gelöscht werden. – Das Tabellenschema kann nicht geändert werden, und die Tabelle kann nicht umbenannt werden. – Die Sicherheit auf Zeilenebene kann nicht auf die Tabelle angewendet werden. |
– Neue Daten werden in OneLake nicht zur Verfügung gestellt. – Daten können gelöscht, abgeschnitten oder gelöscht werden. – Das Tabellenschema kann nicht geändert werden, und die Tabelle kann nicht umbenannt werden. – Daten werden vorläufig aus OneLake gelöscht. |
Wichtig
Es kann einige Stunden dauern, bis die Daten in OneLake angezeigt werden. Weitere Informationen finden Sie unter Adaptives Verhalten.
Für die Verfügbarkeit von OneLake fallen keine zusätzlichen Speicherkosten an. Weitere Informationen finden Sie unter Ressourcenverbrauch.
Voraussetzungen
- Ein Arbeitsbereich mit einer Microsoft Fabric-fähigen Kapazität
- Eine KQL-Datenbank mit Bearbeitungsberechtigungen und Daten
Aktivieren der OneLake-Verfügbarkeit
Sie können die Verfügbarkeit von OneLake entweder auf KQL-Datenbank- oder auf Tabellenebene aktivieren.
Um die Verfügbarkeit von OneLake zu aktivieren, navigieren Sie im Detailbereich Ihrer KQL-Datenbank oder -Tabelle zum OneLake-Abschnitt .
Legen Sie die Verfügbarkeit auf "Ein" fest.
Die Datenbank wird automatisch aktualisiert.
Sie haben die OneLake-Verfügbarkeit in Ihrer KQL-Datenbank aktiviert. Sie können jetzt auf alle neuen Daten zugreifen, die Ihrer Datenbank im angegebenen OneLake-Pfad im Delta Lake-Format hinzugefügt wurden. Sie können außerdem eine OneLake-Verknüpfung aus einem Lakehouse oder Data Warehouse erstellen oder die Daten direkt über den Power BI Direct Lake-Modus abfragen.
Adaptives Verhalten
Eventhouse verfügt über einen stabilen Mechanismus, der eingehende Streams intelligent mittels Batchverarbeitung in eine oder mehrere für die Analyse strukturierte Parquet-Dateien überführt. Die Batchverarbeitung von Streams ist wichtig beim Umgang mit nach und nach eingehenden Daten. Das Schreiben vieler kleiner Parquet-Dateien in den Lake kann ineffizient sein, was höhere Kosten und eine schlechte Leistung zur Folge hat.
Der adaptive Mechanismus von Eventhouse kann Schreibvorgänge um einige Stunden verzögern, wenn zum Erstellen optimaler Parquet-Dateien nicht genügend Daten vorhanden sind. Dadurch wird sichergestellt, dass Parquet-Dateien eine optimale Größe haben und den bewährten Methoden für Delta Lake entsprechen. Der adaptive Mechanismus von Eventhouse stellt sicher, dass die Parquet-Dateien für die Analyse gerüstet sind, und stimmt die Notwendigkeit einer zeitnahen Datenverfügbarkeit mit Kosten- und Leistungsüberlegungen ab.
Sie können überwachen, wie lange es her ist, dass neue Daten in den Lake hinzugefügt wurden, indem Sie die Datenlatenz mit dem Befehl .show table mirroring operations überprüfen.
Die Ergebnisse werden ab dem letzten Hinzufügen von Daten gemessen. Wenn sich eine Latenz von 00:00:00 ergibt, sind alle Daten in der KQL-Datenbank in OneLake verfügbar.
Dateien anzeigen
Wenn Sie die OneLake-Verfügbarkeit für eine Tabelle aktivieren, wird ein Delta-Protokollordner zusammen mit allen entsprechenden JSON- und Parquet-Dateien erstellt. Sie können die Dateien, die in OneLake verfügbar gemacht wurden, und ihre Eigenschaften anzeigen, während Sie sich weiterhin in der Real-Time Intelligence befinden.
Um die Dateien anzuzeigen, zeigen Sie im Explorer-Bereich auf eine Tabelle, und wählen Sie dann das Menü „Mehr“ [...]>Dateien anzeigen aus.
Um die Eigenschaften des Delta-Protokoll-Ordners oder der einzelnen Dateien anzuzeigen, bewegen Sie den Mauszeiger über den Ordner oder die Datei und wählen Sie dann das Menü "Weitere" [...]>Eigenschaften aus.
So zeigen Sie die Dateien im Delta-Protokoll-Ordner an:
- Wählen Sie den Ordner _delta_log aus.
- Wählen Sie eine Datei aus, um die Metadaten und das Schema der Tabelle anzuzeigen. Der Editor, der geöffnet wird, ist im schreibgeschützten Format.
Zugriffsspiegelungsrichtlinie
Beim Einschalten der OneLake-Verfügbarkeit wird standardmäßig eine Spiegelungsrichtlinie aktiviert. Sie können die Richtlinie zum Überwachen der Datenlatenz nutzen oder zum Partitionieren von Deltatabellen ändern.
Hinweis
Wenn Sie die OneLake-Verfügbarkeit ausschalten, wird die Eigenschaft IsEnabled
der Spiegelungsrichtlinie auf false (IsEnabled=false
) gesetzt.
Partitionieren von Delta-Tabellen
Sie können Ihre Delta-Tabellen partitionieren, um die Abfragegeschwindigkeit zu verbessern. Informationen dazu, wann Ihre OneLake-Dateien partitioniert werden sollten, finden Sie unter Gründe für die Partitionierung von Tabellen. Jede Partition wird anhand des in der Partitionsliste aufgeführten PartitionName als separate Spalte dargestellt. Dies bedeutet, dass Ihre OneLake-Kopie mehr Spalten hat als die Quelltabelle.
Verwenden zum Partitionieren Ihrer Delta-Tabellen den Befehl .alter-merge table policy mirroring.
Zugehöriger Inhalt
- Informationen zum Bereitstellen der Daten in OneLake finden Sie unter Erstellen einer Verknüpfung in OneLake
- Informationen zum Erstellen einer OneLake-Verknüpfung in Lakehouse finden Sie unter Was sind Verknüpfungen in Lakehouse?
- Informationen zum Abfragen von Verweisdaten aus OneLake in Ihrer KQL-Datenbank oder -Tabelle finden Sie unter Erstellen einer KQL-Datenbank