Udostępnij za pośrednictwem


Dostępność usługi Eventhouse OneLake

Możesz utworzyć jedną logiczną kopię danych bazy danych KQL w magazynie zdarzeń, włączając dostępność usługi OneLake. Włączenie dostępności usługi OneLake oznacza, że możesz wykonywać zapytania dotyczące danych w bazie danych KQL w formacie usługi Delta Lake za pośrednictwem innych aparatów sieci Szkieletowych, takich jak tryb Direct Lake w usłudze Power BI, Warehouse, Lakehouse, Notebooks i nie tylko.

Usługa Delta Lake to ujednolicony format tabeli data lake, który zapewnia bezproblemowy dostęp do danych we wszystkich aparatach obliczeniowych w usłudze Microsoft Fabric. Aby uzyskać więcej informacji na temat usługi Delta Lake, zobacz Co to jest usługa Delta Lake?.

Z tego artykułu dowiesz się, jak włączyć dostępność danych bazy danych KQL w usłudze OneLake.

Jak to działa

W poniższej tabeli opisano zachowanie bazy danych i tabel języka KQL po włączeniu lub wyłączeniu dostępności usługi OneLake.

Włączone Wyłączone
Baza danych KQL — Nie ma to wpływu na istniejące tabele. Nowe tabele są udostępniane w usłudze OneLake.
— Zasady przechowywania danych bazy danych KQL są również stosowane do danych w usłudze OneLake. Dane usunięte z bazy danych KQL na koniec okresu przechowywania są również usuwane z usługi OneLake.
— Nie ma to wpływu na istniejące tabele. Nowe tabele nie będą dostępne w usłudze OneLake.
Tabela w bazie danych KQL — Nowe dane są udostępniane w usłudze OneLake.
— Istniejące dane nie są wypełniane.
— Nie można usuwać, obcinać ani czyścić danych.
- Nie można zmienić schematu tabeli i nie można zmienić nazwy tabeli.
— Nowe dane nie są udostępniane w usłudze OneLake.
— Dane można usuwać, obcinać lub czyścić.
- Schemat tabeli można zmienić i można zmienić nazwę tabeli.
— Dane są nietrwałe usuwane z usługi OneLake.

Ważne

Wyświetlenie danych w usłudze OneLake może potrwać do kilku godzin. Aby uzyskać więcej informacji, zobacz Adaptacyjne zachowanie.

Nie ma dodatkowych kosztów magazynowania, aby włączyć dostępność usługi OneLake. Aby uzyskać więcej informacji, zobacz Zużycie zasobów.

Wymagania wstępne

Włączanie dostępności usługi OneLake

Dostępność usługi OneLake można włączyć na poziomie bazy danych KQL lub tabeli.

  1. Aby włączyć dostępność usługi OneLake, przejdź do strony szczegółów bazy danych lub tabeli KQL.

  2. Obok pozycji Dostępność usługi OneLake w okienku Szczegóły bazy danych wybierz ikonę Edytuj (ołówek).

    Zrzut ekranu przedstawiający okienko Szczegóły bazy danych w funkcji Analizy w czasie rzeczywistym z wyróżnioną opcją edytowania dostępności usługi OneLake.

  3. Włącz funkcję, przełączając przycisk na Aktywny, a następnie wybierz pozycję Gotowe. Baza danych jest odświeżona automatycznie.

    Zrzut ekranu przedstawiający okno szczegółów folderu OneLake w funkcji Analizy w czasie rzeczywistym w usłudze Microsoft Fabric. Opcja uwidaczniania danych w usłudze OneLake jest włączona.

Włączono dostępność usługi OneLake w bazie danych KQL. Teraz możesz uzyskać dostęp do wszystkich nowych danych dodanych do bazy danych w podanej ścieżce oneLake w formacie usługi Delta Lake. Możesz również utworzyć skrót OneLake z usługi Lakehouse, Data Warehouse lub wykonać zapytanie o dane bezpośrednio za pośrednictwem trybu usługi Power BI Direct Lake.

Zachowanie adaptacyjne

Usługa Eventhouse oferuje niezawodny mechanizm, który inteligentnie dzieli przychodzące strumienie danych na co najmniej jeden plik Parquet ze strukturą na potrzeby analizy. Przetwarzanie wsadowe strumieni danych jest ważne podczas radzenia sobie z podstępem danych. Zapisywanie wielu małych plików Parquet w jeziorze może być nieefektywne, co skutkuje wyższymi kosztami i niską wydajnością.

Mechanizm adaptacyjny usługi Eventhouse może opóźnić operacje zapisu przez maksymalnie kilka godzin, jeśli nie ma wystarczającej ilości danych, aby utworzyć optymalne pliki Parquet. Dzięki temu pliki Parquet są optymalne pod względem rozmiaru i są zgodne z najlepszymi rozwiązaniami usługi Delta Lake. Mechanizm adaptacyjny usługi Eventhouse zapewnia, że pliki Parquet są przeznaczone do analizy i równoważą potrzebę zapewnienia szybkiej dostępności danych z uwzględnieniem kosztów i wydajności.

Możesz monitorować, jak długo temu nowe dane zostały dodane w usłudze Lake, sprawdzając opóźnienie danych przy użyciu polecenia .show table mirroring operations (Pokaż operacje dublowania tabel).

Wyniki są mierzone z czasu ostatniego dodania danych. Gdy opóźnienie powoduje wyświetlenie wartości 00:00:00, wszystkie dane w bazie danych KQL są dostępne w usłudze OneLake.

Wyświetlanie plików

Po włączeniu dostępności usługi OneLake w tabeli zostanie utworzony folder dziennika różnicowego wraz z odpowiednimi plikami JSON i Parquet. Możesz wyświetlić pliki, które zostały udostępnione w usłudze OneLake i ich właściwościach, pozostając w ramach analizy w czasie rzeczywistym.

  • Aby wyświetlić pliki, umieść kursor nad tabelą w okienku Eksplorator , a następnie wybierz menu Więcej [...]>Wyświetlanie plików.

    Zrzut ekranu przedstawiający okienko Eksplorator z listą rozwijaną Więcej menu tabeli.

  • Aby wyświetlić właściwości folderu dziennika delty lub poszczególnych plików, umieść kursor nad folderem lub plikiem, a następnie wybierz menu Więcej [...]>Właściwości.

  • Aby wyświetlić pliki w folderze dziennika różnicowego:

    1. Wybierz folder _delta_log.
    2. Wybierz plik, aby wyświetlić metadane i schemat tabeli. Otwierany edytor jest w formacie tylko do odczytu.

Zasady dublowania dostępu

Domyślnie po włączeniu dostępności usługi OneLake zasady dublowania są włączone. Za pomocą zasad można monitorować opóźnienie danych lub zmieniać je w tabelach różnicowych partycji.

Uwaga

Jeśli wyłączysz dostępność usługi OneLake, właściwość zasad IsEnabled dublowania jest ustawiona na wartość false (IsEnabled=false).

Partycjonowanie tabel różnicowych

Tabele różnicowe można podzielić na partycje, aby zwiększyć szybkość wykonywania zapytań. Aby uzyskać informacje o tym, kiedy partycjonować pliki OneLake, zobacz Kiedy partycjonować tabele. Każda partycja jest reprezentowana jako oddzielna kolumna przy użyciu nazwy partycji wymienionej na liście Partycje. Oznacza to, że kopia oneLake ma więcej kolumn niż tabela źródłowa.

Aby podzielić tabele różnicowe, użyj polecenia dublowania zasad tabeli alter-merge.