Debugowanie przepływu danych mapowania

Ukończone

Podczas tworzenia Przepływ danych mapowania można interaktywnie obserwować sposób wykonywania przekształceń danych w celu ich debugowania. Aby użyć tej funkcji, należy najpierw włączyć funkcję "Przepływ danych Debug".

Starting Data Flow Debug

Kliknięcie pozycji Debugowanie spowoduje aprowizowanie klastrów Spark wymaganych do interakcji z przekształceniami mapowania Przepływ danych. Po włączeniu opcji Debugowanie zostanie wyświetlony monit o wybranie środowiska Integration Runtime, które jest wymagane do użycia w środowisku. Jeśli wybierzesz pozycję AutoResolveIntegrationRuntime, klaster z ośmioma rdzeniami, które będą dostępne z czasem wygaśnięcia wartości 60 minut.

Uwaga

Uruchomienie klastra zwykle trwa od 5 do 7 minut. W przypadku korzystania z tego trybu i uruchomionych klastrów Spark możesz utworzyć przepływ danych krok po kroku i wyświetlić dane w miarę ich uruchamiania w każdej fazie transformacji.

Karta Podgląd danych jest dostępna w trybie debugowania, który umożliwia wyświetlanie danych na każdym etapie potoku. Dane można wyświetlić po każdej transformacji. Podgląd danych zapewnia również możliwość wykonywania akcji dotyczących danych, takich jak analizowanie opisowych statystyk danych lub możliwość modyfikowania danych.

Data Previewer

Na koniec możesz użyć ustawień debugowania, aby kontrolować liczbę wierszy zwracanych w podglądzie danych.

Uwaga

Zaleca się ograniczenie liczby wierszy, które zwracają wystarczająco dużo, aby umożliwić potwierdzenie, że dane są poprawne. Im większy zestaw danych, tym dłużej trwa zwracanie wyników z powrotem. Możesz również użyć ustawień debugowania, aby określić dowolne wartości parametrów, które mają być używane podczas wykonywania potoku.