Wprowadzenie do optymalizowania wydajności

Ukończone

Optymalizowanie wydajności, nazywane również dostrajaniem wydajności, obejmuje wprowadzanie zmian w bieżącym stanie modelu danych, dzięki czemu działa on bardziej wydajnie. Zasadniczo, gdy model danych jest zoptymalizowany, działa lepiej.

Może się okazać, że w przypadku raportu, który działa dobrze w środowisku testowym i programistycznym, po wdrożeniu w środowisku produkcyjnym w celu udostępnienia do szerszego użycia, pojawiają się problemy z wydajnością. Z perspektywy użytkownika raportu niska wydajność objawia się dłuższym czasem ładowania stron raportu i aktualizowania wizualizacji. Ta niska wydajność skutkuje negatywnym doświadczeniem użytkownika.

Jako analityk danych będziesz poświęcać około 90% czasu na pracę z danymi i dziewięć razy z dziesięciu niska wydajność będzie bezpośrednim wynikiem nieprawidłowego modelu danych, nieprawidłowych wyrażeń języka DAX lub kombinacji tych dwóch czynników. Proces projektowania modelu danych pod kątem wydajności może być żmudny i często jest niedoceniany. Jeśli jednak rozwiążesz problemy z wydajnością podczas programowania, będziesz mieć niezawodny model danych usługi Power BI o lepszej wydajności raportowania i bardziej pozytywnych doświadczeniach użytkownika. Ostatecznie będziesz także w stanie utrzymać zoptymalizowaną wydajność. W miarę rozwoju organizacji ilość danych rośnie, a model danych staje się bardziej skomplikowany. Dzięki wczesnemu zoptymalizowaniu modelu danych można złagodzić negatywny wpływ tego rozwoju na wydajność modelu danych.

Mniejszy model danych zużywa mniej zasobów (pamięci) i pozwala na szybsze odświeżanie danych, obliczenia i renderowanie wizualizacji w raportach. W związku z tym proces optymalizacji wydajności obejmuje minimalizowanie rozmiaru modelu danych i optymalne wykorzystanie danych w modelu, w tym:

  • Upewnienie się, że są używane poprawne typy danych.

  • Usuwanie niepotrzebnych kolumn i wierszy.

  • Unikanie powtarzających się wartości.

  • Zamienianie kolumn liczbowych na miary.

  • Zmniejszanie kardynalności.

  • Analizowanie metadanych modelu.

  • Podsumowywanie danych, gdy jest to możliwe.

Zrzut ekranu, który demostuje zadania w tym module.

W tym module przedstawimy procedury, procesy i koncepcje, które są niezbędne do optymalizacji modelu danych pod kątem wydajności na poziomie przedsiębiorstwa. Należy jednak pamiętać, że mimo iż podstawowe wskazówki dotyczące wydajności i najlepsze rozwiązania w usłudze Power BI pozwolą Ci osiągnąć dużo, to w celu zoptymalizowania modelu danych pod kątem wydajności zapytań prawdopodobnie trzeba będzie nawiązać współpracę z inżynierem danych, aby zoptymalizować model danych już na poziomie danych źródłowych.

Załóżmy na przykład, że pracujesz jako deweloper usługi Power BI firmy Microsoft dla organizacji Tailwind Traders. Powierzono Ci zadanie przejrzenia modelu danych, który został utworzony kilka lat temu przez innego dewelopera, który już nie pracuje w tej organizacji.

Model danych generuje raport, który otrzymał negatywne opinie od użytkowników. Użytkownicy są zadowoleni z wyników widocznych w raporcie, ale nie są zadowoleni z wydajności raportu. Ładowanie stron w raporcie trwa zbyt długo, a tabele nie są odświeżane wystarczająco szybko, gdy wprowadzane są pewne wybory. Poza tymi opiniami zespół IT podkreśla, że rozmiar pliku tego konkretnego modelu danych jest zbyt duży i powoduje ograniczenie zasobów organizacji.

Musisz przejrzeć model danych w celu zidentyfikowania głównej przyczyny problemów z wydajnością i wprowadzić zmiany w celu zoptymalizowania wydajności.

Po ukończeniu tego modułu będziesz wiedzieć, jak wykonać następujące czynności:

  • Przeglądanie wydajności miar, relacji i wizualizacji.

  • Zwiększanie wydajności i rozwiązywanie problemów przy użyciu zmiennych.

  • Zwiększanie wydajności za pomocą obniżania poziomów kardynalności.

  • Optymalizowanie modeli DirectQuery za pomocą magazynu na poziomie tabeli.

  • Tworzenie agregacji i zarządzanie nimi.