Udostępnij za pośrednictwem


Przekształcanie danych przez uruchomienie aktywności definicji zadania Spark

Działanie Definicja zadania platformy Spark w usłudze Data Factory dla usługi Microsoft Fabric umożliwia tworzenie połączeń z definicjami zadań platformy Spark i uruchamianie ich z potoku danych.

Warunki wstępne

Aby rozpocząć pracę, należy spełnić następujące wymagania wstępne:

Dodaj definicję zadania Spark do potoku przy użyciu interfejsu użytkownika

  1. Utwórz nowy potok danych w obszarze roboczym.

  2. Wyszukaj "Definicja zadania Spark" na karcie głównej i wybierz ją lub wybierz akcję na pasku aktywności, aby dodać ją do kanwy przepływu pracy.

    • Tworzenie aktywności z poziomu karty ekranu głównego:

      Zrzut ekranu przedstawiający miejsce utworzenia nowego działania definicji zadania platformy Spark.

    • Tworzenie działania na pasku Działania:

      Zrzut ekranu przedstawiający miejsce utworzenia nowego działania Definicji zadania platformy Spark na pasku Działania w oknie edytora potoków.

  3. Wybierz nowe działanie Definicji zadania platformy Spark na kanwie edytora potoków, jeśli nie zostało jeszcze wybrane.

    Zrzut ekranu przedstawiający działanie definicji zadania Spark na kanwie edytora potoków.

    Aby skonfigurować opcje dostępne na karcie ustawienia ogólne, zapoznaj się ze wskazówkami dotyczącymi ustawienia ogólne.

Ustawienia działania definicji zadania platformy Spark

Wybierz kartę Ustawienia w okienku właściwości działania, a następnie wybierz obszar roboczy Fabric zawierający definicję zadania Spark, które chcesz uruchomić.

Zrzut ekranu przedstawiający kartę Ustawienia właściwości definicji zadania Spark w ekranie edytora potoku.

Znane ograniczenia

Bieżące ograniczenia działania definicji zadań platformy Spark dla usługi Fabric Data Factory są wymienione tutaj. Ta sekcja może ulec zmianie.

  • Obecnie nie obsługujemy tworzenia nowego działania definicji zadania platformy Spark w ramach działania (w obszarze Ustawienia)
  • Obsługa parametryzacji nie jest dostępna.
  • Mimo że obsługujemy monitorowanie działania za pośrednictwem karty danych wyjściowych, nie można jeszcze monitorować definicji zadań platformy Spark na bardziej szczegółowym poziomie. Na przykład, linki do strony monitorowania, statusu, czasu trwania i poprzednich przebiegów definicji zadań Spark nie są bezpośrednio dostępne w Data Factory. Można jednak wyświetlić bardziej szczegółowe informacje na stronie monitorowania definicji zadań platformy Spark .

Zapisz i uruchom lub zaplanuj potok

Po skonfigurowaniu innych działań wymaganych dla potoku przejdź do karty Narzędzia główne w górnej części edytora potoków i wybierz przycisk zapisz, aby zapisać potok. Wybierz pozycję Uruchom, aby uruchomić ją bezpośrednio, lub Harmonogram, aby go zaplanować. Historię uruchamiania można również wyświetlić tutaj lub skonfigurować inne ustawienia.

Zrzut ekranu przedstawiający kartę Strona główna edytora potoków z wyróżnionymi przyciskami Zapisz, Uruchom i Zaplanuj.

Jak monitorować uruchomienia potoków