Udostępnij przez


Szybki start: tworzenie rozwiązania do przenoszenia i przekształcania danych

Z tego przewodnika szybkiego startu dowiesz się, jak przepływy danych i potoki współpracują, aby utworzyć potężne rozwiązanie Data Factory. Dane zostaną oczyszczone za pomocą przepływów danych i przeniesione za pomocą potoków.

Warunki wstępne

Przed rozpoczęciem potrzebne są następujące elementy:

Porównanie przepływów danych i potoków

Przepływ danych Gen2 udostępnia interfejs o niskim kodzie z 300+ danymi i przekształceniami opartymi na sztucznej inteligencji. Dzięki elastyczności można łatwo czyścić, przygotowywać i przekształcać dane. Pipeliny oferują zaawansowane możliwości orkiestracji danych, umożliwiające tworzenie elastycznych przepływów danych spełniające potrzeby Twojego przedsiębiorstwa.

W potoku można tworzyć logiczne grupowania działań, które wykonują zadanie. Może to obejmować wywołanie przepływu danych w celu oczyszczenia i przygotowania danych. Chociaż istnieją pewne funkcje, które się pokrywają, wybór zależy od tego, czy potrzebujesz pełnych możliwości potoków, czy też można korzystać z prostszych możliwości przepływów danych. Aby uzyskać więcej informacji, zobacz Przewodnik po decyzjach dotyczących Fabric.

Przekształcanie danych za pomocą przepływów danych

Wykonaj następujące kroki, aby skonfigurować przepływ danych.

Utwórz przepływ danych

  1. Wybierz obszar roboczy z funkcją Fabric, a następnie Nowy i wybierz Przepływ danych Gen2.

    Zrzut ekranu przedstawiający uruchamianie przepływu danych Gen2.

  2. W edytorze przepływu danych wybierz pozycję Importuj z programu SQL Server.

    Zrzut ekranu przedstawiający edytor przepływu danych.

Pobierz dane

  1. W oknie dialogowym Łączenie ze źródłem danych wprowadź szczegóły bazy danych Azure SQL Database i wybierz pozycję Dalej. Użyj przykładowej bazy danych AdventureWorksLT z wymagań wstępnych.

    Zrzut ekranu przedstawiający nawiązywanie połączenia z bazą danych Azure SQL Database.

  2. Wybierz dane do przekształcenia, takie jak SalesLT.Customer, i użyj pozycji Wybierz powiązane tabele , aby uwzględnić powiązane tabele. Następnie wybierz Utwórz.

    Zrzut ekranu przedstawiający wybieranie danych do przekształcenia.

Przekształcanie danych

  1. Wybierz pozycję Widok diagramu z paska stanu lub menu Widok w edytorze Power Query.

    Zrzut ekranu przedstawiający wybieranie widoku diagramu.

  2. Wybierz prawym przyciskiem myszy zapytanie SalesLT Customer lub wybierz wielokropek pionowy po prawej stronie zapytania, a następnie wybierz pozycję Scal zapytania.

    Zrzut ekranu przedstawiający opcję Łączenie zapytań.

  3. Skonfiguruj scalanie z SalesLTOrderHeader jako prawą tabelą, CustomerID jako kolumną sprzężenia i lewe zewnętrzne sprzężenie jako typem sprzężenia. Kliknij przycisk OK.

    zrzut ekranu przedstawiający ekran konfiguracji scalania.

  4. Dodaj miejsce docelowe danych, wybierając symbol bazy danych ze strzałką. Wybierz pozycję Azure SQL Database jako typ docelowy.

    Zrzut ekranu przedstawiający przycisk Dodaj miejsce docelowe danych.

  5. Podaj szczegóły połączenia usługi Azure SQL Database, w którym ma zostać opublikowane zapytanie scalania. W tym przykładzie używamy bazy danych AdventureWorksLT , która również była źródłem danych dla miejsca docelowego.

    Zrzut ekranu przedstawiający panel Łączenie z miejscem docelowym danych.

  6. Wybierz bazę danych do przechowywania danych i podaj nazwę tabeli, a następnie wybierz pozycję Dalej.

    Zrzut ekranu przedstawiający okno Wybieranie miejsca docelowego.

  7. Zaakceptuj ustawienia domyślne w oknie dialogowym Wybieranie ustawień docelowych i wybierz pozycję Zapisz ustawienia.

    Zrzut ekranu przedstawiający okno dialogowe Wybieranie ustawień docelowych.

  8. Wybierz pozycję Publikuj w edytorze przepływu danych, aby opublikować przepływ danych.

    Zrzut ekranu z wyróżnionym przyciskiem Publikuj w edytorze przepływu danych Gen2.

Przenoszenie danych za pomocą potoków

Po utworzeniu przepływu danych Gen2, możesz nim operować w potoku. W tym przykładzie skopiujesz dane wygenerowane z przepływu danych do formatu tekstowego na koncie usługi Azure Blob Storage.

Tworzenie nowego potoku

  1. W obszarze roboczym wybierz Nowy, a następnie Potok.

    Zrzut ekranu przedstawiający tworzenie nowego potoku.

  2. Nadaj potokowi nazwę i wybierz pozycję Utwórz.

    Zrzut ekranu przedstawiający monit o utworzenie nowego potoku z nazwą przykładowego potoku.

Konfigurowanie przepływu danych

  1. Dodaj działanie przepływu danych do potoku, wybierając Przepływ danych na karcie Działania.

    Zrzut ekranu przedstawiający dodawanie działania przepływu danych.

  2. Wybierz przepływ danych na kanwie potoku, przejdź do karty Ustawienia i wybierz utworzony wcześniej przepływ danych.

    Zrzut ekranu przedstawiający wybieranie przepływu danych.

  3. Wybierz pozycję Zapisz, a następnie uruchom , aby wypełnić scaloną tabelę zapytań.

    Zrzut ekranu pokazujący, gdzie wybrać opcję Uruchom.

Dodawanie działania kopiowania

  1. Wybierz pozycję Kopiuj dane na kanwie lub użyj Asystenta kopiowania na karcie Działania .

    Zrzut ekranu przedstawiający dwa sposoby uzyskiwania dostępu do asystenta kopiowania.

  2. Wybierz pozycję Azure SQL Database jako źródło danych, a następnie wybierz pozycję Dalej.

    Zrzut ekranu przedstawiający miejsce wybierania źródła danych.

  3. Utwórz połączenie ze źródłem danych, wybierając pozycję Utwórz nowe połączenie. Wypełnij wymagane informacje o połączeniu na panelu, a następnie wprowadź nazwę AdventureWorksLT jako nazwę bazy danych, w której wygenerowaliśmy zapytanie scalania w przepływie danych. Następnie wybierz pozycję Dalej.

    Zrzut ekranu przedstawiający miejsce utworzenia nowego połączenia.

  4. Wybierz tabelę wygenerowaną wcześniej w kroku przepływu danych, a następnie wybierz pozycję Dalej.

    Zrzut ekranu przedstawiający sposób wybierania spośród dostępnych tabel.

  5. Jako miejsce docelowe wybierz Azure Blob Storage, a następnie Dalej.

    Zrzut ekranu przedstawiający miejsce docelowe danych usługi Azure Blob Storage.

  6. Utwórz połączenie z miejscem docelowym, wybierając pozycję Utwórz nowe połączenie. Podaj szczegóły połączenia, a następnie wybierz pozycję Dalej.

    Zrzut ekranu przedstawiający sposób tworzenia połączenia.

  7. Wybierz ścieżkę folderu i podaj nazwę pliku , a następnie wybierz pozycję Dalej.

    Zrzut ekranu przedstawiający sposób wybierania ścieżki folderu i nazwy pliku.

  8. Ponownie wybierz przycisk Dalej , aby zaakceptować domyślny format pliku, ogranicznik kolumny, ogranicznik wierszy i typ kompresji, opcjonalnie w tym nagłówek.

    Zrzut ekranu przedstawiający opcje konfiguracji pliku w usłudze Azure Blob Storage.

  9. Finalizuj ustawienia. Następnie przejrzyj i wybierz pozycję Zapisz i uruchom, aby zakończyć proces.

    zrzut ekranu przedstawiający sposób przeglądania ustawień kopiowania danych.

Zaprojektuj swój potok i zapisz, aby uruchomić i załadować dane.

  1. Aby uruchomić działanie kopiowania po działaniu Przepływ danych, przeciągnij z fragmentu Powodzenie na działanie kopiowania w działaniu Przepływ danych. Działanie Kopiowanie jest uruchamiane tylko po pomyślnym zakończeniu działania Przepływ danych.

    Zrzut ekranu przedstawiający sposób uruchamiania przepływu danych po działaniu kopiowania.

  2. Wybierz Zapisz, aby zapisać potok. Następnie wybierz pozycję Uruchom, aby uruchomić pipeline i załadować dane.

    zrzut ekranu pokazujący, gdzie wybrać pozycję Zapisz i uruchom.

Harmonogram wykonywania potoku

Po zakończeniu tworzenia i testowania potoku możesz zaplanować jego automatyczne uruchamianie.

  1. Na karcie Narzędzia główne okna edytora potoków wybierz pozycję Harmonogram.

    Zrzut ekranu przedstawiający przycisk Harmonogram w menu karty Narzędzia główne w edytorze potoku.

  2. Skonfiguruj harmonogram zgodnie z wymaganiami. W tym przykładzie zaplanowano uruchamianie potoku codziennie o godzinie 18:00 do końca roku.

    Zrzut ekranu przedstawiający konfigurację harmonogramu dla potoku do uruchomienia codziennie o godzinie 18:00 do końca roku.

W tym przykładzie pokazano, jak utworzyć i skonfigurować przepływ danych Gen2 w celu utworzenia zapytania scalania i zapisania go w bazie danych Azure SQL Database, a następnie skopiować dane z bazy danych do pliku tekstowego w usłudze Azure Blob Storage. Wiesz już, jak wykonać następujące działania:

  • Tworzenie przepływu danych.
  • Przekształcanie danych za pomocą przepływu danych.
  • Stwórz pipeline przy użyciu przepływu danych.
  • Zleć wykonywanie kroków w potoku.
  • Kopiowanie danych za pomocą Asystenta kopiowania.
  • Uruchom i zaplanuj swój rurociąg.

Następnie kontynuuj, aby dowiedzieć się więcej na temat monitorowania przebiegów potoku.