Udostępnij za pośrednictwem


Diagnozowanie długiego etapu na platformie Spark

Zacznij od zidentyfikowania najdłuższego etapu zadania. Przewiń do dołu strony zadania do listy etapów i ustaw je według czasu trwania:

Długi etap

Szczegóły we/wy etapu

Aby wyświetlić ogólne dane dotyczące tego, co robi ten etap, zapoznaj się z kolumnami Dane wejściowe, Wyjściowe, Shuffle Read i Shuffle Write :

Długie we/wy etapu

Kolumny oznaczają następujące elementy:

  • Dane wejściowe: ile danych ten etap odczytuje z magazynu. Może to być odczyt z usługi Delta, Parquet, CSV itp.
  • Dane wyjściowe: ile danych na tym etapie zapisywało w magazynie. Może to być zapis w usłudze Delta, Parquet, CSV itp.
  • Shuffle Read: Ile danych mieszania jest odczytywanych na tym etapie.
  • Shuffle Write: Ile danych mieszania napisał ten etap.

Jeśli nie znasz tego, co to jest shuffle, teraz jest dobry czas, aby dowiedzieć się , co to oznacza.

Zanotuj te liczby, ponieważ prawdopodobnie będą one potrzebne później.

Liczba zadań

Liczba zadań na długim etapie może wskazywać na kierunek problemu. Liczbę zadań można określić, patrząc tutaj:

Określanie liczby zadań

Jeśli widzisz jedno zadanie, może to być oznaką problemu. Aby uzyskać więcej informacji, zobacz One Spark task (Zadanie platformy Spark).

Wyświetl więcej szczegółów etapu

Jeśli etap ma więcej niż jedno zadanie, należy zbadać dokładniej. Kliknij link w opisie etapu, aby uzyskać więcej informacji na temat najdłuższego etapu:

Informacje o otwartym etapie

Teraz, gdy jesteś na stronie etapu, zobacz Niesymetryczność i rozlanie.