Wprowadzenie do Azure Data Factory

DOTYCZY: Azure Data Factory Azure Synapse Analytics

Tip

Data Factory w usłudze Microsoft Fabric jest następną generacją Azure Data Factory z prostszą architekturą, wbudowaną sztuczną inteligencją i nowymi funkcjami. Jeśli dopiero zaczynasz integrować dane, zacznij od Fabric Data Factory. Istniejące obciążenia ADF można zaktualizować do Fabric, aby uzyskać dostęp do nowych możliwości w zakresie nauki o danych, analiz w czasie rzeczywistym oraz raportowania.

Witamy w Azure Data Factory! Ten artykuł pomoże Ci utworzyć swój pierwszy Data Factory i pipeline w ciągu pięciu minut.

Szablon Azure Resource Manager (szablon usługi ARM) w tym artykule tworzy i konfiguruje wszystko, czego potrzebujesz. Następnie możesz przejść do fabryki danych demo i uruchomić potok, który przenosi przykładowe dane z jednego folderu w Azure Blob Storage do innego folderu.

Wymagania wstępne

Jeśli nie masz subskrypcji Azure, przed rozpoczęciem utwórz konto free.

Podsumowanie wideo

Poniższy film wideo zawiera przewodnik po przykładzie w tym artykule:

Krok 1: Użyj demonstracji do tworzenia zasobów

W tym scenariuszu demonstracyjnym użyjesz działania copy w fabryce danych, aby skopiować obiekt blob o nazwie moviesDB2.csv z folderu wejściowego w Azure Blob Storage do folderu wyjściowego. W rzeczywistym scenariuszu ta operacja kopiowania może znajdować się między dowolnym z wielu obsługiwanych źródeł danych i ujściami dostępnymi w usłudze. Może również obejmować przekształcenia w danych.

  1. Wybierz poniższy przycisk.

    Wypróbuj swoją pierwszą demonstrację fabryki danych

    Wybranie przycisku spowoduje utworzenie następujących zasobów Azure:

    • Konto Azure Data Factory
    • Fabryka danych zawierająca pipeline z jedną aktywnością kopiowania
    • Konto Azure Blob Storage z moviesDB2.csv przesłanym do folderu wejściowego jako źródło
    • Połączona usługa łącząca fabrykę danych z usługą Blob Storage
  2. Zostanie przekierowana do strony konfiguracji w celu wdrożenia szablonu. Na tej stronie:

    1. W obszarze Grupa zasobów wybierz pozycję Utwórz nową , aby utworzyć grupę zasobów. Możesz pozostawić wszystkie inne wartości z ich wartościami domyślnymi.

    2. Wybierz Przejrzyj i utwórz, a następnie wybierz Utwórz, aby wdrożyć zasoby.

    Zrzut ekranu przedstawiający stronę wdrażania szablonu na potrzeby tworzenia zasobów.

Uwaga

Użytkownik wdrażający szablon musi przypisać rolę do tożsamości zarządzanej. Ten krok wymaga uprawnień, które można udzielić za pośrednictwem roli Właściciel, Administrator dostępu użytkowników lub Operator tożsamości zarządzanej.

Wszystkie zasoby w tej demonstracji są tworzone w nowo utworzonej grupie zasobów, dzięki czemu można je później łatwo usunąć.

Krok 2. Przegląd wdrożonych zasobów

  1. W komunikacie, który pokazuje pomyślne zakończenie wdrożenia, wybierz pozycję Przejdź do grupy zasobów.

    Zrzut ekranu przedstawiający stronę portalu Azure z pomyślnym wdrożeniem szablonu demonstracyjnego.

  2. Grupa zasobów obejmuje nową fabrykę danych, konto Blob Storage i tożsamość zarządzaną utworzoną przez wdrożenie. Aby wyświetlić fabrykę danych, wybierz ją w grupie zasobów.

    Zrzut ekranu przedstawiający zawartość grupy zasobów utworzonej na potrzeby pokazu z wyróżnioną fabryką danych.

  3. Wybierz przycisk Uruchom studio .

    Zrzut ekranu portalu Azure pokazujący szczegóły nowo utworzonej Azure Data Factory, z wyróżnionym przyciskiem otwierania środowiska Azure Data Factory Studio.

  4. W programie Azure Data Factory Studio:

    1. Wybierz kartę Autorkartę Autor.
    2. Wybierz potok utworzony przez szablon.
    3. Sprawdź dane źródłowe, wybierając pozycję Otwórz.

    Zrzut ekranu z Azure Data Factory Studio, który pokazuje potok utworzony przez szablon.

  5. W źródłowym zestawie danych wybierz pozycję Przeglądaj , aby wyświetlić plik wejściowy utworzony dla pokazu.

    Zrzut ekranu przedstawiający źródłowy zestaw danych z wyróżnionym przyciskiem Przeglądaj.

    Zwróć uwagę na plik moviesDB2.csv, który został już załadowany do folderu wejściowego.

    Zrzut ekranu przedstawiający zawartość folderu wejściowego z plikiem wejściowym używanym w pokazie.

Krok 3: Uruchom potok demonstracyjny

  1. Wybierz pozycję Dodaj wyzwalacz, a następnie wybierz pozycję Wyzwól teraz.

    Zrzut ekranu przedstawiający przycisk wyzwalania potoku demonstracyjnego do uruchomienia.

  2. W okienku po prawej stronie w obszarze Uruchamianie potoku wybierz przycisk OK.

Monitoruj potok

  1. Wybierz kartę Monitorkartę Monitor. Ta karta zawiera omówienie przebiegów potoków, w tym czas rozpoczęcia i stan.

    Zrzut ekranu przedstawiający kartę monitorowania przebiegów potoku w fabryce danych.

  2. W tym skróconym przewodniku pipeline ma tylko jeden typ aktywności: Kopiowanie danych. Wybierz nazwę kanału, aby zobaczyć szczegóły wyników działania kopiowania.

    Zrzut ekranu przedstawiający wyniki przebiegu działania kopiowania na karcie do monitorowania fabryki danych.

  3. Wybierz ikonę Szczegóły , aby wyświetlić szczegółowy proces kopiowania. W wynikach rozmiary odczytanych danych i zapisane dane są takie same, a jeden plik został odczytany i zapisany. Te informacje dowodzą, że wszystkie dane zostały pomyślnie skopiowane do miejsca docelowego.

    Zrzut ekranu przedstawiający szczegółowe wyniki procesu działania dla operacji kopiowania.

Czyszczenie zasobów

Wszystkie zasoby utworzone w tym artykule można wyczyścić na jeden z dwóch sposobów:

  • Możesz usuń całą grupę zasobów Azure zawierającą wszystkie utworzone w niej zasoby.

  • Jeśli chcesz zachować niektóre zasoby bez zmian, przejdź do grupy zasobów i usuń tylko określone zasoby, które chcesz usunąć.

    Na przykład, jeśli używasz tego szablonu do skonfigurowania fabryki danych w celu wykorzystania jej w innym samouczku, możesz usunąć inne zasoby, pozostawiając jedynie fabrykę danych.

W tym artykule utworzyłeś fabrykę danych, która zawierała proces z działaniem kopiowania. Aby dowiedzieć się więcej na temat Azure Data Factory, przejdź do następującego artykułu i modułu szkoleniowego: