Dostępność usługi Eventhouse OneLake
Możesz utworzyć jedną logiczną kopię danych bazy danych KQL w magazynie zdarzeń, włączając dostępność usługi OneLake. Włączenie dostępności usługi OneLake oznacza, że możesz wykonywać zapytania dotyczące danych w bazie danych KQL w formacie usługi Delta Lake za pośrednictwem innych aparatów sieci Szkieletowych, takich jak tryb Direct Lake w usłudze Power BI, Warehouse, Lakehouse, Notebooks i nie tylko.
Usługa Delta Lake to ujednolicony format tabeli data lake, który zapewnia bezproblemowy dostęp do danych we wszystkich aparatach obliczeniowych w usłudze Microsoft Fabric. Aby uzyskać więcej informacji na temat usługi Delta Lake, zobacz Co to jest usługa Delta Lake?.
Z tego artykułu dowiesz się, jak włączyć dostępność danych bazy danych KQL w usłudze OneLake.
Jak to działa
W poniższej tabeli opisano zachowanie bazy danych i tabel języka KQL po włączeniu lub wyłączeniu dostępności usługi OneLake.
Ważne
Wyświetlenie danych w usłudze OneLake może potrwać do kilku godzin. Aby uzyskać więcej informacji, zobacz Adaptacyjne zachowanie.
Nie ma dodatkowych kosztów magazynowania, aby włączyć dostępność usługi OneLake. Aby uzyskać więcej informacji, zobacz Zużycie zasobów.
Wymagania wstępne
- Obszar roboczy z pojemnością z włączoną usługą Microsoft Fabric
- Baza danych KQL z uprawnieniami do edycji i danymi
Włączanie dostępności usługi OneLake
Dostępność usługi OneLake można włączyć na poziomie bazy danych KQL lub tabeli.
Aby włączyć dostępność usługi OneLake, przejdź do sekcji OneLake w okienku szczegółów bazy danych lub tabeli KQL.
Ustaw wartość Dostępność na Wł.
Baza danych jest odświeżona automatycznie.
Włączono dostępność usługi OneLake w bazie danych KQL. Teraz możesz uzyskać dostęp do wszystkich nowych danych dodanych do bazy danych w podanej ścieżce oneLake w formacie usługi Delta Lake. Możesz również utworzyć skrót OneLake z usługi Lakehouse, Data Warehouse lub wykonać zapytanie o dane bezpośrednio za pośrednictwem trybu usługi Power BI Direct Lake.
Zachowanie adaptacyjne
Usługa Eventhouse oferuje niezawodny mechanizm, który inteligentnie dzieli przychodzące strumienie danych na co najmniej jeden plik Parquet ze strukturą na potrzeby analizy. Przetwarzanie wsadowe strumieni danych jest ważne podczas radzenia sobie z podstępem danych. Zapisywanie wielu małych plików Parquet w jeziorze może być nieefektywne, co skutkuje wyższymi kosztami i niską wydajnością.
Mechanizm adaptacyjny usługi Eventhouse może opóźnić operacje zapisu przez maksymalnie kilka godzin, jeśli nie ma wystarczającej ilości danych, aby utworzyć optymalne pliki Parquet. Dzięki temu pliki Parquet są optymalne pod względem rozmiaru i są zgodne z najlepszymi rozwiązaniami usługi Delta Lake. Mechanizm adaptacyjny usługi Eventhouse zapewnia, że pliki Parquet są przeznaczone do analizy i równoważą potrzebę zapewnienia szybkiej dostępności danych z uwzględnieniem kosztów i wydajności.
Możesz monitorować, jak długo temu nowe dane zostały dodane w usłudze Lake, sprawdzając opóźnienie danych przy użyciu polecenia .show table mirroring operations (Pokaż operacje dublowania tabel).
Wyniki są mierzone z czasu ostatniego dodania danych. Gdy opóźnienie powoduje wyświetlenie wartości 00:00:00, wszystkie dane w bazie danych KQL są dostępne w usłudze OneLake.
Wyświetlanie plików
Po włączeniu dostępności usługi OneLake w tabeli zostanie utworzony folder dziennika różnicowego wraz z odpowiednimi plikami JSON i Parquet. Możesz wyświetlić pliki, które zostały udostępnione w usłudze OneLake i ich właściwościach, pozostając w ramach analizy w czasie rzeczywistym.
Aby wyświetlić pliki, umieść kursor nad tabelą w okienku Eksplorator , a następnie wybierz menu Więcej [...]>Wyświetlanie plików.
Aby wyświetlić właściwości folderu dziennika delty lub poszczególnych plików, umieść kursor nad folderem lub plikiem, a następnie wybierz menu Więcej [...]>Właściwości.
Aby wyświetlić pliki w folderze dziennika różnicowego:
- Wybierz folder _delta_log.
- Wybierz plik, aby wyświetlić metadane i schemat tabeli. Otwierany edytor jest w formacie tylko do odczytu.
Zasady dublowania dostępu
Domyślnie po włączeniu dostępności usługi OneLake zasady dublowania są włączone. Za pomocą zasad można monitorować opóźnienie danych lub zmieniać je w tabelach różnicowych partycji.
Uwaga
Jeśli wyłączysz dostępność usługi OneLake, właściwość zasad IsEnabled
dublowania jest ustawiona na wartość false (IsEnabled=false
).
Partycjonowanie tabel różnicowych
Tabele różnicowe można podzielić na partycje, aby zwiększyć szybkość wykonywania zapytań. Aby uzyskać informacje o tym, kiedy partycjonować pliki OneLake, zobacz Kiedy partycjonować tabele. Każda partycja jest reprezentowana jako oddzielna kolumna przy użyciu nazwy partycji wymienionej na liście Partycje. Oznacza to, że kopia oneLake ma więcej kolumn niż tabela źródłowa.
Aby podzielić tabele różnicowe, użyj polecenia dublowania zasad tabeli alter-merge.
Powiązana zawartość
- Aby uwidocznić dane w usłudze OneLake, zobacz Tworzenie skrótu w usłudze OneLake
- Aby utworzyć skrót OneLake w usłudze Lakehouse, zobacz Co to są skróty w lakehouse?
- Aby wysłać zapytanie dotyczące danych z usługi OneLake w bazie danych lub tabeli KQL, zobacz Tworzenie skrótu OneLake w bazie danych KQL