Diagnozowanie problemów z kosztami i wydajnością przy użyciu interfejsu użytkownika platformy Spark

W tym przewodniku przedstawiono sposób używania interfejsu użytkownika platformy Spark do diagnozowania problemów z kosztami i wydajnością. Jest to przewodnik krok po kroku i jest praktycznym przewodnikiem. Zamiast po prostu dostarczać wyjaśnienie, co robi każda strona w interfejsie użytkownika platformy Spark, informuje o tym, co należy szukać i co to znaczy. Jeśli nie znasz pojęć dotyczących sterowników, procesów roboczych, funkcji wykonawczych, etapów i zadań, warto przejrzeć architekturę platformy Spark.

Jeśli szukasz kompleksowej listy różnych narzędzi optymalizacji, skorzystaj z przewodnika Optymalizacji usługi Databricks. Sekcje przewodnika optymalizacji znajdują się w tym przewodniku po interfejsie użytkownika platformy Spark.

Używanie tego przewodnika

Aby przejść przez przewodnik, użyj linków osadzonych na każdej stronie, aby przejść do następnego kroku. Przewodnik zawiera następujące kroki w następującej kolejności:

  1. Użyj osi czasu zadań, aby zidentyfikować główne problemy
  2. Spójrz na najdłuższy etap
  3. Poszukaj niesymetryczności lub rozlania
  4. Określanie, czy najdłuższy etap jest powiązany z we/wy
  5. Poszukaj innych przyczyn wolno działającego środowiska uruchomieniowego

Zaczynajmy!

Jak otworzyć interfejs użytkownika platformy Spark

  1. Przejdź do strony klastra:

    Przejdź do obszaru Obliczenia

  2. Kliknij pozycję Interfejs użytkownika platformy Spark:

    Przejdź do interfejsu SparkUI

Następny krok

Po otwarciu interfejsu użytkownika platformy Spark przejrzyj oś czasu zdarzenia, aby dowiedzieć się więcej o potoku lub zapytaniu. Zobacz Oś czasu zadań.