Udostępnij za pośrednictwem


Pozyskiwanie danych do magazynu przy użyciu potoków danych

Dotyczy:✅ Magazyn w Microsoft Fabric

Potoki danych oferują alternatywę dla używania polecenia COPY za pomocą graficznego interfejsu użytkownika. Potok danych to logiczne grupowanie działań, które razem wykonują zadanie pozyskiwania danych. Rurociągi umożliwiają zarządzanie działaniami wyodrębniania, przekształcania i ładowania (ETL) zamiast zarządzania każdym z osobna.

W tym samouczku utworzysz nowy potok, który ładuje przykładowe dane do hurtowni danych w usłudze Microsoft Fabric.

Uwaga

Niektóre funkcje usługi Azure Data Factory nie są dostępne w usłudze Microsoft Fabric, ale koncepcje są zamienne. Więcej informacji na temat usługi Azure Data Factory i potoków można uzyskać w temacie Pipelines and activities in Azure Data Factory and Azure Synapse Analytics (Potoki i działania w usługach Azure Data Factory i Azure Synapse Analytics). Aby zapoznać się z przewodnikiem Szybki start, odwiedź stronę Szybki start: tworzenie pierwszego potoku w celu skopiowania danych.

Tworzenie potoku danych

  1. Aby utworzyć nowy potok, przejdź do obszaru roboczego, wybierz przycisk +Nowy i wybierz pozycję Potok danych. Zrzut ekranu przedstawiający górną sekcję obszaru roboczego użytkownika z przyciskiem Nowy element w sekcji Pobieranie danych. Przycisk Potok danych został wyróżniony.

  2. Aby utworzyć nowy potok, przejdź do obszaru roboczego, wybierz przycisk + Nowy element i wybierz pozycję Potok danych.

    • W obszarze roboczym wybierz pozycję + Nowy element i poszukaj karty Potok danych w sekcji Pobieranie danych .
    • Możesz też wybrać pozycję Utwórz w okienku nawigacji. Poszukaj karty Potok danych w sekcji Data Factory .
  3. W oknie dialogowym Nowy potok podaj nazwę nowego potoku i wybierz pozycję Utwórz.

  4. Nastąpi przekierowanie do obszaru kanwy potoku, w którym zobaczysz opcje rozpoczęcia pracy.

    Zrzut ekranu przedstawiający trzy opcje do wybrania na potrzeby rozpoczęcia pozyskiwania.

    Wybierz opcję Asystent kopiowania danych, aby uruchomić Asystent kopiowania.

  5. Pierwsza strona asystenta kopiowania danych pomaga wybrać własne dane z różnych źródeł danych lub wybrać jedną z podanych przykładów, aby rozpocząć pracę. Wybierz pozycję Przykładowe dane na pasku menu na tej stronie. Na potrzeby tego samouczka użyjemy przykładu COVID-19 Data Lake . Wybierz tę opcję i wybierz przycisk Dalej.

    Zrzut ekranu przedstawiający opcje użycia przykładowych danych lub innych źródeł danych.

  6. Na następnej stronie możesz wybrać zestaw danych, format pliku źródłowego i wyświetlić podgląd wybranego zestawu danych. Wybierz pozycję Bing COVID-19, format CSV i wybierz przycisk Dalej.

    Zrzut ekranu przedstawiający różne opcje zestawu danych dla przykładu COVID-19, formatów plików i siatki przedstawiającej podgląd danych.

  7. Następna strona, Miejsca docelowe danych, umożliwia skonfigurowanie typu docelowego obszaru roboczego. Załadujemy dane do magazynu w naszym obszarze roboczym. Wybierz żądany magazyn z listy rozwijanej i wybierz pozycję Dalej.

  8. Ostatnim krokiem do skonfigurowania miejsca docelowego jest podanie nazwy tabeli docelowej i skonfigurowanie mapowań kolumn. W tym miejscu możesz załadować dane do nowej tabeli lub istniejącej, podać schemat i nazwy tabel, zmienić nazwy kolumn, usunąć kolumny lub zmienić ich mapowania. Możesz zaakceptować wartości domyślne lub dostosować ustawienia do swoich preferencji.

    Zrzut ekranu przedstawiający opcje ładowania danych do istniejącej tabeli lub utworzenia nowego.

    Po zakończeniu przeglądania opcji wybierz pozycję Dalej.

  9. Następna strona daje możliwość użycia etapowania lub oferuje zaawansowane opcje do operacji kopiowania danych (która używa polecenia T-SQL COPY). Przejrzyj opcje bez ich zmiany, a następnie wybierz przycisk Dalej.

  10. Ostatnia strona asystenta zawiera podsumowanie działania kopiowania. Wybierz opcję Rozpocznij transfer danych natychmiast , a następnie wybierz pozycję Zapisz i uruchom.

    Zrzut ekranu przedstawiający opcję natychmiastowego uruchomienia operacji transferu danych oraz przycisków Wstecz i Zapisz i Uruchom.

  11. Zostanie przekierowany do obszaru kanwy potoku, w którym skonfigurowano już nowe działanie Kopiowania danych. Potok zostanie uruchomiony automatycznie. Można monitorować status przepływu zadań w okienku Dane wyjściowe:

    Zrzut ekranu przedstawiający kanwę potoku z działanie Kopiuj w środku oraz stan wykonywania potoku przedstawiający bieżący stan W toku.

  12. Po kilku sekundach potok zakończy się pomyślnie. Po powrocie do magazynu możesz wybrać tabelę, aby wyświetlić podgląd danych i potwierdzić zakończenie operacji kopiowania.

Aby uzyskać więcej informacji na temat importowania danych do magazynu w usłudze Microsoft Fabric, odwiedź:

Następny krok