Dostępność usługi Eventhouse OneLake

Artykuł
02/02/2025

Kopię logiczną danych bazy KQL można utworzyć w centrum zdarzeń, włączając dostępność usługi OneLake. Włączenie dostępności usługi OneLake oznacza, że możesz wykonywać zapytania dotyczące danych w bazie danych KQL w formacie usługi Delta Lake za pośrednictwem innych aparatów sieci Szkieletowych, takich jak tryb Direct Lake w usłudze Power BI, Warehouse, Lakehouse, Notebooks i nie tylko.

Usługa Delta Lake to ujednolicony format tabeli data lake, który zapewnia bezproblemowy dostęp do danych we wszystkich aparatach obliczeniowych w usłudze Microsoft Fabric. Aby uzyskać więcej informacji na temat usługi Delta Lake, zobacz Co to jest usługa Delta Lake?.

Z tego artykułu dowiesz się, jak włączyć dostępność danych bazy danych KQL w usłudze OneLake.

Jak to działa

Możesz włączyć dostępności OneLake na poziomie bazy danych lub tabeli. Po włączeniu na poziomie bazy danych wszystkie nowe tabele i ich dane są udostępniane w usłudze OneLake. Po włączeniu funkcji możesz również zastosować tę opcję do istniejących tabel, wybierając opcję Zastosuj do istniejących tabel. Włączenie na poziomie tabeli sprawia, że tylko ta tabela i jej dane są dostępne w usłudze OneLake. Zasady przechowywania danych bazy danych KQL są również stosowane do danych w usłudze OneLake. Dane usunięte z bazy danych KQL na koniec okresu przechowywania są również usuwane z usługi OneLake. Jeśli wyłączysz dostępność OneLake, dane zostaną tymczasowo usunięte z OneLake.

Gdy dostępność OneLake jest włączone, nie można wykonać następujących zadań:

Zmienianie nazw tabel
Zmienianie schematów tabel
Stosowanie zabezpieczeń na poziomie wiersza do tabel
Nie można usunąć, skrócić ani wyczyścić danych

Jeśli musisz wykonać dowolne z tych zadań, wykonaj następujące czynności:

Ważne

Wyłączenie dostępności oneLake usuwania nietrwałych danych z usługi OneLake. Po włączeniu dostępności tylko nowe dane są udostępniane w usłudze OneLake bez wypełniania usuniętych danych.

Wyłącz dostępność OneLake .
Wykonaj żądane zadanie.
Włącz dostępność OneLake .

Ważne

Aby uzyskać więcej informacji na temat czasu wyświetlania danych w usłudze OneLake, zobacz zachowanie adaptacyjne.

Nie ma dodatkowych kosztów magazynowania, aby włączyć dostępność usługi OneLake. Aby uzyskać więcej informacji, zobacz Zużycie zasobów.

Wymagania wstępne

Obszar roboczy z pojemnością z włączoną usługą Microsoft Fabric
Baza danych KQL z uprawnieniami do edycji i danymi

Włączanie dostępności usługi OneLake

Dostępność usługi OneLake można włączyć na poziomie bazy danych KQL lub tabeli.

Aby włączyć dostępność usługi OneLake, przejdź do sekcji OneLake w okienku szczegółów bazy danych lub tabeli KQL.
Ustaw wartość Dostępność na Wł.
Baza danych jest odświeżona automatycznie.

Włączono dostępność usługi OneLake w bazie danych KQL. Teraz możesz uzyskać dostęp do wszystkich nowych danych dodanych do bazy danych w podanej ścieżce oneLake w formacie usługi Delta Lake. Możesz również utworzyć skrót OneLake z usługi Lakehouse, Data Warehouse lub wykonać zapytanie o dane bezpośrednio za pośrednictwem trybu usługi Power BI Direct Lake.

Zachowanie adaptacyjne

Usługa Eventhouse oferuje niezawodny mechanizm, który inteligentnie dzieli przychodzące strumienie danych na co najmniej jeden plik Parquet ze strukturą na potrzeby analizy. Przetwarzanie wsadowe strumieni danych jest ważne podczas radzenia sobie z podstępem danych. Zapisywanie wielu małych plików Parquet w jeziorze może być nieefektywne, co skutkuje wyższymi kosztami i niską wydajnością.

Mechanizm adaptacyjny usługi Eventhouse może opóźnić operacje zapisu, jeśli nie ma wystarczającej ilości danych, aby utworzyć optymalne pliki Parquet. Dzięki temu pliki Parquet są optymalne pod względem rozmiaru i są zgodne z najlepszymi rozwiązaniami usługi Delta Lake. Mechanizm adaptacyjny usługi Eventhouse zapewnia, że pliki Parquet są przeznaczone do analizy i równoważą potrzebę zapewnienia szybkiej dostępności danych z uwzględnieniem kosztów i wydajności.

Uwaga

Domyślnie operacja zapisu może potrwać do 3 godzin lub do momentu utworzenia plików o wystarczającym rozmiarze (zazwyczaj 200–256 MB).
Opóźnienie można dostosować do wartości z zakresu od 5 minut do 3 godzin.

Na przykład użyj następującego polecenia, aby ustawić opóźnienie na 5 minut:

.alter-merge table <TableName> policy mirroring dataformat=parquet with (IsEnabled=true, TargetLatencyInMinutes=5);

Ostrożność

Dostosowanie opóźnienia do krótszego okresu może spowodować nieoptymalną tabelę różnicową z dużą liczbą małych plików, co może prowadzić do nieefektywnej wydajności zapytań. Wynikowa tabela w usłudze OneLake jest tylko do odczytu i nie można jej zoptymalizować po utworzeniu.

Możesz monitorować, jak dawno temu nowe dane zostały dodane w jeziorze, sprawdzając opóźnienie danych przy użyciu polecenia .show table mirroring operations.

Wyniki są mierzone z czasu ostatniego dodania danych. Gdy opóźnienie powoduje wyświetlenie wartości 00:00:00, wszystkie dane w bazie danych KQL są dostępne w usłudze OneLake.

Wyświetlanie plików

Po włączeniu dostępności usługi OneLake w tabeli zostanie utworzony folder dziennika różnicowego wraz z odpowiednimi plikami JSON i Parquet. Możesz wyświetlić pliki, które zostały udostępnione w usłudze OneLake i ich właściwościach, pozostając w ramach analizy w czasie rzeczywistym.

Aby wyświetlić pliki, umieść kursor nad tabelą w okienku Eksplorator , a następnie wybierz menu Więcej [...]>Wyświetlanie plików.
Aby wyświetlić właściwości folderu dziennika delty lub poszczególnych plików, umieść kursor nad folderem lub plikiem, a następnie wybierz menu Więcej [...]>Właściwości.
Aby wyświetlić pliki w folderze dziennika różnicowego:
1. Wybierz folder _delta_log.
2. Wybierz plik, aby wyświetlić metadane i schemat tabeli. Otwierany edytor jest w formacie tylko do odczytu.

Zasady dublowania dostępu

Domyślnie po włączeniu dostępności usługi OneLake zasady dublowania są włączone. Za pomocą zasad można monitorować opóźnienie danych lub zmieniać je w tabelach różnicowych partycji.

Uwaga

Jeśli wyłączysz dostępność usługi OneLake, właściwość zasad IsEnabled dublowania jest ustawiona na wartość false (IsEnabled=false).

Partycjonowanie tabel różnicowych

Tabele różnicowe można podzielić na partycje, aby zwiększyć szybkość wykonywania zapytań. Aby uzyskać informacje o tym, kiedy partycjonować pliki OneLake, zobacz Kiedy partycjonować tabele. Każda partycja jest reprezentowana jako oddzielna kolumna przy użyciu nazwy partycji wymienionej na liście Partycje. Oznacza to, że kopia oneLake ma więcej kolumn niż tabela źródłowa.

Aby podzielić tabele różnicowe, użyj polecenia dublowania zasad tabeli alter-merge.

Aby uwidocznić dane w usłudze OneLake, zobacz Tworzenie skrótu w usłudze OneLake
Aby utworzyć skrót OneLake w usłudze Lakehouse, zobacz Co to są skróty w lakehouse?
Aby zapytać o dane z usługi OneLake w bazie danych lub tabeli KQL, zobacz Utwórz skrót OneLake w bazie danych KQL

Udostępnij za pośrednictwem

Dostępność usługi Eventhouse OneLake

Jak to działa

Wymagania wstępne

Włączanie dostępności usługi OneLake

Zachowanie adaptacyjne

Wyświetlanie plików

Zasady dublowania dostępu

Partycjonowanie tabel różnicowych

Opinia

Dodatkowe zasoby

Udostępnij za pośrednictwem

Dostępność usługi Eventhouse OneLake

Jak to działa

Wymagania wstępne

Włączanie dostępności usługi OneLake

Zachowanie adaptacyjne

Wyświetlanie plików

Zasady dublowania dostępu

Partycjonowanie tabel różnicowych

Powiązana zawartość

Opinia

Dodatkowe zasoby