Optymalizowanie pod kątem wysokiej współbieżności za pomocą usługi Azure Data Explorer

Wysoce współbieżne aplikacje są niezbędne w scenariuszach z dużą bazą użytkowników, gdzie aplikacja jednocześnie obsługuje wiele żądań z małym opóźnieniem i wysoką przepływnością.

Przypadki użycia obejmują pulpity monitorowania i alertów w dużej skali. Przykłady obejmują produkty i usługi firmy Microsoft, takie jak Azure Monitor i Playfab. Wszystkie te usługi używają usługi Azure Data Explorer do obsługi obciążeń o wysokiej współbieżności. Azure Data Explorer to szybka, w pełni zarządzana usługa analizy danych big data na potrzeby analizy danych w czasie rzeczywistym na dużych ilościach danych przesyłanych strumieniowo z aplikacji, witryn internetowych, urządzeń IoT i nie tylko.

Uwaga

Rzeczywista liczba zapytań, które mogą być uruchamiane współbieżnie w klastrze, zależy od czynników, takich jak jednostka SKU klastra, woluminy danych, złożoność zapytań i wzorce użycia.

Aby skonfigurować aplikacje o wysokiej współbieżności, zaprojektuj architekturę zaplecza w następujący sposób:

Optymalizowanie danych
Ustaw wzorzec architektury lider-uczestnik
Optymalizowanie zapytań
Ustawianie zasad klastra
Monitorowanie klastrów usługi Azure Data Explorer

W tym artykule przedstawiono zalecenia dotyczące każdego z powyższych tematów, które można zaimplementować w celu osiągnięcia wysokiej współbieżności w optymalny, ekonomiczny sposób. Używaj tych funkcji samodzielnie lub w połączeniu.

Optymalizowanie danych

W przypadku wysokiej współbieżności zapytania powinny zużywać najmniej możliwą ilość zasobów procesora CPU. Użyj dowolnej lub wszystkich następujących metod:

Zoptymalizowany projekt schematu tabeli
Data partitioning (Partycjonowanie danych)
Wstępne agregowanie
Buforowanie

Korzystanie z najlepszych rozwiązań dotyczących projektowania schematu tabeli

Skorzystaj z poniższych sugestii dotyczących projektowania schematu tabeli, aby zminimalizować używane zasoby procesora CPU:

Zdefiniuj kolumny identyfikatorów jako typy danych ciągów, nawet jeśli wartości są liczbowe. Indeksowanie kolumn ciągów jest bardziej zaawansowane niż w przypadku kolumn liczbowych i zapewnia lepszą wydajność filtrowania.
Dopasuj typ danych kolumny optymalnie do rzeczywistych danych przechowywanych w tych kolumnach. Na przykład nie przechowuj wartości daty/godziny w kolumnie ciągu.
Unikaj dużej tabeli rozrzedzanej z wieloma kolumnami i używaj kolumn dynamicznych do przechowywania rozrzedzanych właściwości.
Przechowuj często używane właściwości we własnej kolumnie przy użyciu niedynamicznego typu danych.
Zdenormalizuj dane, aby uniknąć sprzężeń, które wymagają stosunkowo dużych zasobów procesora CPU.

Partycjonowanie danych

Dane są przechowywane w postaci zakresów (fragmentów danych) i są domyślnie partycjonowane według czasu pozyskiwania. Za pomocą polityki partycjonowania można ponownie podzielić zakresy na podstawie jednej kolumny ciągu lub jednej kolumny daty/godziny w procesie w tle. Partycjonowanie może zapewnić znaczną poprawę wydajności, gdy większość zapytań używa kluczy partycji do filtrowania, agregowania lub obu tych operacji.

Uwaga

Sam proces partycjonowania używa zasobów procesora CPU. Jednak zmniejszenie zużycia CPU podczas wykonywania zapytania powinno przeważyć nad CPU używanym do partycjonowania.

Wstępnie agregować dane przy użyciu zmaterializowanych widoków

Wstępna agregacja danych w celu znacznego zmniejszenia obciążenia CPU podczas zapytań. Przykładowe scenariusze obejmują podsumowanie punktów danych w zmniejszonej liczbie przedziałów czasu, przechowywanie najnowszego rekordu danego rekordu lub deduplikację zestawu danych. Użyj zmaterializowanych widoków , aby łatwo skonfigurować zagregowany widok dla tabel źródłowych. Ta funkcja upraszcza proces tworzenia i obsługi tych zagregowanych widoków.

Uwaga

Proces agregacji w tle używa zasobów procesora CPU. Jednak redukcja użycia procesora w czasie zapytania powinna przewyższać jego użycie do agregacji.

Konfigurowanie zasad buforowania

Skonfiguruj zasady buforowania tak, aby zapytania działały na danych przechowywanych w magazynie gorącym, nazywanym również pamięcią podręczną dysku. Uruchamiaj tylko ograniczone, starannie zaprojektowane scenariusze na zimnym magazynie lub w tabelach zewnętrznych.

Ustawienie wzorca architektury lider-obserwator

Baza danych obserwująca to funkcja śledzenia bazy danych lub zestawu tabel z innego klastra, który znajduje się w tym samym regionie. Dostęp do tej funkcji można uzyskać za pośrednictwem usługi Azure Data Share, interfejsów API usługi Azure Resource Manager i zestawu poleceń klastra.

Użyj wzorca lider-obserwator, aby skonfigurować zasoby obliczeniowe dla różnych zasobów roboczych. Na przykład skonfiguruj klaster na potrzeby pozyskiwania danych, klaster do wykonywania zapytań lub obsługi pulpitów nawigacyjnych lub aplikacji oraz klaster obsługujący obciążenia nauki o danych. Każde obciążenie w tym przypadku ma dedykowane zasoby obliczeniowe, które można skalować niezależnie, oraz różne konfiguracje buforowania i zabezpieczeń. Wszystkie klastry korzystają z tych samych danych, przy czym lider zapisuje dane, a śladowcy używają ich w trybie tylko do odczytu.

Uwaga

Bazy danych podrzędnych mają opóźnienie od lidera, które zwykle wynosi kilka sekund. Jeśli twoje rozwiązanie wymaga najnowszych danych bez opóźnień, to rozwiązanie może nie być przydatne. Użyj widoku na klastrze obserwowanym, który łączy dane z lidera i obserwowanego oraz wykonuje zapytania o najnowsze dane od lidera i resztę danych z obserwatora.

Aby zwiększyć wydajność zapytań w klastrze podrzędnym, możesz włączyć konfigurację zakresów pobierania wstępnego. Użyj tej konfiguracji ostrożnie, ponieważ może to mieć wpływ na świeżość danych w poniższej bazie danych.

Optymalizowanie zapytań

Użyj następujących metod, aby zoptymalizować zapytania pod kątem wysokiej współbieżności.

Postępuj zgodnie z najlepszymi rozwiązaniami dotyczącymi zapytań, aby zapytania są tak wydajne, jak to możliwe.

Używanie pamięci podręcznej wyników zapytania

Gdy więcej niż jeden użytkownik ładuje ten sam pulpit nawigacyjny w podobnym czasie, pulpit nawigacyjny dla drugiego i kolejnych użytkowników może być wyświetlany z pamięci podręcznej. Ta konfiguracja zapewnia wysoką wydajność bez użycia procesora CPU. Użyj funkcji pamięci podręcznej wyników zapytania i wyślij konfigurację pamięci podręcznej wyników zapytania za pomocą zapytania przy użyciu instrukcji set .

Grafana zawiera ustawienie konfiguracji pamięci podręcznej wyników zapytania na poziomie źródła danych, więc wszystkie pulpity nawigacyjne używają tego ustawienia domyślnie i nie muszą modyfikować zapytania.

Konfigurowanie spójności zapytań

Domyślny tryb spójności zapytania jest silny. W tym trybie węzeł administracyjny zarządza metadanymi i przetwarzaniem danych dla klastra, a także planuje i deleguje wykonywanie zapytań do innych węzłów.

W aplikacjach o wysokiej współbieżności zarządzanie zapytaniami może spowodować wysokie użycie procesora CPU węzła administracyjnego , podczas gdy inne węzły są mniej zajęte. Taka sytuacja może spowodować wąskie gardło, w którym liczba współbieżnych zapytań nie może wzrosnąć. Jednak to wąskie gardło może nie być widoczne w raporcie procesora CPU klastra (azure portal > {your_cluster} > Metryka procesora > CPU), która pokazuje średnie użycie procesora CPU dla klastra.

W tym scenariuszu użyj słabego trybu spójności. W tym trybie więcej węzłów zarządza zapytaniami, co umożliwia skalowanie w poziomie liczby współbieżnych zapytań. Węzły w tym trybie okresowo odświeżają kopię metadanych i nowo pozyskanych danych, co prowadzi do opóźnienia zwykle krótszego niż minutę w miarę synchronizowania danych. Jednak to krótkie opóźnienie jest bardziej pożądane niż sytuacja wąskiego gardła, która może wystąpić w przypadku korzystania z trybu silnej spójności.

Ustaw tryb spójności w polityce spójności zapytań grupy obciążeń, we właściwościach żądania klienta lub w konfiguracji źródła danych Grafana.

Ustawianie zasad klastra

Zasady limitu szybkości żądań domyślnie ograniczają liczbę współbieżnych żądań, aby klaster nie był przeciążony. Można dostosować tę politykę w sytuacjach o wysokiej współbieżności. Dostosuj te zasady dopiero po rygorystycznym testowaniu, najlepiej w przypadku wzorców użycia podobnych do środowiska produkcyjnego i zestawów danych. Testowanie gwarantuje, że klaster może utrzymać zmodyfikowaną wartość. Skonfiguruj ten limit na podstawie potrzeb aplikacji.

Monitorowanie klastrów usługi Azure Data Explorer

Monitorowanie kondycji zasobów klastra ułatwia utworzenie planu optymalizacji przy użyciu funkcji sugerowanych w poprzednich sekcjach. Usługa Azure Monitor dla usługi Azure Data Explorer zapewnia kompleksowy widok wydajności, operacji, użycia i niepowodzeń klastra. Uzyskaj szczegółowe informacje na temat wydajności zapytań, współbieżnych zapytań, ograniczonych zapytań i różnych innych metryk, wybierając kartę Szczegółowe informacje (wersja zapoznawcza) w sekcji Monitorowanie klastra usługi Azure Data Explorer w witrynie Azure Portal.

Aby uzyskać informacje na temat monitorowania klastrów, zobacz Usługa Azure Monitor dla usługi Azure Data Explorer.

Opinia

Czy ta strona była pomocna?

Last updated on 2026-02-23

Udostępnij za pośrednictwem

Optymalizowanie pod kątem wysokiej współbieżności za pomocą usługi Azure Data Explorer

Optymalizowanie danych

Korzystanie z najlepszych rozwiązań dotyczących projektowania schematu tabeli

Partycjonowanie danych

Wstępnie agregować dane przy użyciu zmaterializowanych widoków

Konfigurowanie zasad buforowania

Ustawienie wzorca architektury lider-obserwator

Optymalizowanie zapytań

Używanie pamięci podręcznej wyników zapytania

Konfigurowanie spójności zapytań

Ustawianie zasad klastra

Monitorowanie klastrów usługi Azure Data Explorer

Opinia

Dodatkowe zasoby