Jak kopiować dane przy użyciu działania kopiowania

W potoku danych można użyć działanie Kopiuj do kopiowania danych między magazynami danych znajdującymi się w chmurze.

Po skopiowaniu danych możesz użyć innych działań, aby jeszcze bardziej je przekształcić i przeanalizować. Możesz również użyć działanie Kopiuj, aby opublikować wyniki transformacji i analizy na potrzeby analizy biznesowej i użycia aplikacji.

Aby skopiować dane ze źródła do miejsca docelowego, usługa uruchamiana przez działanie Kopiuj wykonuje następujące kroki:

  1. Odczytuje dane ze źródłowego magazynu danych.
  2. Wykonuje serializacji/deserializacji, kompresji/dekompresji, mapowania kolumn itd. Wykonuje te operacje na podstawie konfiguracji.
  3. Zapisuje dane w docelowym magazynie danych.

Wymagania wstępne

Aby rozpocząć pracę, należy spełnić następujące wymagania wstępne:

  • Konto dzierżawy usługi Microsoft Fabric z aktywną subskrypcją. Utwórz konto bezpłatnie.

  • Upewnij się, że masz obszar roboczy z włączoną usługą Microsoft Fabric.

Dodawanie działania kopiowania przy użyciu asystenta kopiowania

Wykonaj następujące kroki, aby skonfigurować działanie kopiowania przy użyciu asystenta kopiowania.

Rozpoczynanie pracy z asystentem kopiowania

  1. Otwórz istniejący potok danych lub utwórz nowy potok danych.

  2. Wybierz pozycję Kopiuj dane na kanwie, aby otworzyć narzędzie Asystent kopiowania, aby rozpocząć pracę. Możesz też wybrać pozycję Użyj asystenta kopiowania z listy rozwijanej Kopiowanie danych na karcie Działania na wstążce.

    Screenshot showing options for opening the copy assistant.

Konfigurowanie źródła

  1. Wybierz typ źródła danych z kategorii. Jako przykład użyjesz usługi Azure Blob Storage. Wybierz pozycję Azure Blob Storage , a następnie wybierz pozycję Dalej.

    Screenshot of Choose data source screen.

    Screenshot showing where to select the correct data source.

  2. Utwórz połączenie ze źródłem danych, wybierając pozycję Utwórz nowe połączenie.

    Screenshot showing where to select New connection.

    Po wybraniu pozycji Utwórz nowe połączenie wypełnij wymagane informacje o połączeniu, a następnie wybierz pozycję Dalej. Aby uzyskać szczegółowe informacje na temat tworzenia połączenia dla każdego typu źródła danych, możesz zapoznać się z każdym artykułem dotyczącym łącznika.

    Jeśli masz istniejące połączenia, możesz wybrać pozycję Istniejące połączenie i wybrać połączenie z listy rozwijanej.

    Screenshot showing the existing connection.

  3. Wybierz plik lub folder, który ma zostać skopiowany w tym kroku konfiguracji źródłowej, a następnie wybierz przycisk Dalej.

    Screenshot showing where to select the data to be copied.

Konfigurowanie miejsca docelowego

  1. Wybierz typ źródła danych z kategorii. Jako przykład użyjesz usługi Azure Blob Storage. Wybierz pozycję Azure Blob Storage, a następnie wybierz pozycję Dalej.

    Screenshot showing how to select Azure Blob Storage.

  2. Możesz utworzyć nowe połączenie, które łączy się z nowym kontem usługi Azure Blob Storage, wykonując kroki opisane w poprzedniej sekcji lub używając istniejącego połączenia z listy rozwijanej połączenia. Możliwości połączenia testowego i edycji są dostępne dla każdego wybranego połączenia.

    Screenshot showing data connection options.

  3. Skonfiguruj i zamapuj dane źródłowe na miejsce docelowe. Następnie wybierz przycisk Dalej , aby zakończyć konfiguracje docelowe.

    Screenshot of Map to destination screen.

    Screenshot of Connect to data destination.

Przeglądanie i tworzenie działania kopiowania

  1. Przejrzyj ustawienia działania kopiowania w poprzednich krokach i wybierz przycisk OK , aby zakończyć. Możesz też wrócić do poprzednich kroków, aby edytować ustawienia w razie potrzeby w narzędziu.

    Screenshot showing the Review and create screen.

Po zakończeniu działanie kopiowania zostanie dodane do kanwy potoku danych. Wszystkie ustawienia, w tym ustawienia zaawansowane dla tego działania kopiowania, są dostępne na kartach po jej wybraniu.

Screenshot showing a copy activity on the data pipeline canvas.

Teraz możesz zapisać potok danych przy użyciu tego pojedynczego działania kopiowania lub kontynuować projektowanie potoku danych.

Bezpośrednie dodawanie działania kopiowania

Wykonaj następujące kroki, aby bezpośrednio dodać działanie kopiowania.

Dodawanie działania kopiowania

  1. Otwórz istniejący potok danych lub utwórz nowy potok danych.

  2. Dodaj działanie kopiowania, wybierając pozycję Dodaj działanie> potoku działanie Kopiuj lub wybierając pozycję Kopiuj dane>Dodaj do kanwy na karcie Działania.

    Screenshot showing two ways to add a copy activity.

Konfigurowanie ustawień ogólnych na karcie Ogólne

Aby dowiedzieć się, jak skonfigurować ustawienia ogólne, zobacz Ogólne.

Konfigurowanie źródła na karcie Źródło

  1. Wybierz pozycję + Nowy obok Połączenie ion, aby utworzyć połączenie ze źródłem danych.

    Screenshot showing where to select New.

    1. Wybierz typ źródła danych w oknie podręcznym. Jako przykład użyjesz usługi Azure SQL Database. Wybierz pozycję Azure SQL Database, a następnie wybierz pozycję Kontynuuj.

      Screenshot showing how to select the data source.

    2. Przechodzi do strony tworzenia połączenia. Wypełnij wymagane informacje o połączeniu na panelu, a następnie wybierz pozycję Utwórz. Aby uzyskać szczegółowe informacje na temat tworzenia połączenia dla każdego typu źródła danych, możesz zapoznać się z każdym artykułem dotyczącym łącznika.

      Screenshot showing New connection page.

    3. Po pomyślnym utworzeniu połączenia następuje powrót do strony potoku danych. Następnie wybierz pozycję Odśwież , aby pobrać połączenie utworzone z listy rozwijanej. Możesz również wybrać istniejące połączenie usługi Azure SQL Database bezpośrednio z listy rozwijanej, jeśli zostało już utworzone wcześniej. Możliwości połączenia testowego i edycji są dostępne dla każdego wybranego połączenia. Następnie wybierz pozycję Azure SQL Database w typie Połączenie ion.

      Screenshot showing where to refresh your connection.

  2. Określ tabelę do skopiowania. Wybierz pozycję Podgląd danych , aby wyświetlić podgląd tabeli źródłowej. Możesz również użyć procedury kwerendy i procedury składowanej, aby odczytywać dane ze źródła.

    Screenshot showing source table settings options.

  3. Rozwiń pozycję Zaawansowane , aby uzyskać bardziej zaawansowane ustawienia.

    Screenshot of advanced settings.

Konfigurowanie miejsca docelowego na karcie Miejsce docelowe

  1. Wybierz typ miejsca docelowego. Może to być wewnętrzny magazyn danych pierwszej klasy z obszaru roboczego, takiego jak Lakehouse, lub zewnętrzne magazyny danych. Jako przykład użyjesz usługi Lakehouse.

    Screenshot showing where to select destination type.

  2. Wybierz opcję użycia usługi Lakehouse w typie magazynu danych obszaru roboczego. Wybierz pozycję + Nowy, a następnie przejdź do strony tworzenia usługi Lakehouse. Określ nazwę usługi Lakehouse, a następnie wybierz pozycję Utwórz.

    Screenshot showing Lakehouse creation.

  3. Po pomyślnym utworzeniu połączenia następuje powrót do strony potoku danych. Następnie wybierz pozycję Odśwież , aby pobrać połączenie utworzone z listy rozwijanej. Możesz również wybrać istniejące połączenie usługi Lakehouse bezpośrednio z listy rozwijanej, jeśli zostało już utworzone wcześniej.

    Screenshot showing selecting connection.

  4. Określ tabelę lub skonfiguruj ścieżkę pliku, aby zdefiniować plik lub folder jako miejsce docelowe. W tym miejscu wybierz pozycję Tabele i określ tabelę do zapisu danych.

    Screenshot showing where to find Table settings.

  5. Rozwiń pozycję Zaawansowane , aby uzyskać bardziej zaawansowane ustawienia.

    Screenshot of Advanced options.

Teraz możesz zapisać potok danych przy użyciu tego pojedynczego działania kopiowania lub kontynuować projektowanie potoku danych.

Konfigurowanie mapowań na karcie mapowania

Jeśli stosowany łącznik obsługuje mapowanie, możesz przejść do karty Mapowanie , aby skonfigurować mapowanie.

  1. Wybierz pozycję Importuj schematy , aby zaimportować schemat danych.

    Screenshot of mapping settings 1.

  2. Zobaczysz, że jest wyświetlane automatyczne mapowanie. Określ kolumnę Źródło i kolumnę Docelową . Jeśli tworzysz nową tabelę w miejscu docelowym, możesz dostosować nazwę kolumny Destination tutaj. Jeśli chcesz zapisać dane w istniejącej tabeli docelowej, nie możesz zmodyfikować istniejącej nazwy kolumny Destination . Można również wyświetlić kolumny Typ źródła i miejsca docelowego.

    Screenshot of mapping settings 2.

Poza tym możesz wybrać pozycję + Nowe mapowanie, aby dodać nowe mapowanie, wybrać pozycję Wyczyść, aby wyczyścić wszystkie ustawienia mapowania, a następnie wybrać pozycję Resetuj, aby zresetować wszystkie kolumny źródłowe mapowania.

Konfigurowanie konwersji typu

Rozwiń węzeł Ustawienia konwersji typu, aby w razie potrzeby skonfigurować konwersję typu.

Screenshot of mapping type conversion.

Aby uzyskać szczegółowe informacje o ustawieniu, zobacz poniższą tabelę.

Ustawienie opis
Zezwalaj na obcinanie danych Zezwalaj na obcinanie danych podczas konwertowania danych źródłowych na miejsce docelowe z innym typem podczas kopiowania. Na przykład od liczby dziesiętnej do liczby całkowitej od DatetimeOffset do daty/godziny.
Traktuj wartość logiczną jako liczbę Traktuj wartość logiczną jako liczbę. Na przykład traktuj wartość true jako 1.
Format daty/godziny Formatuj ciąg podczas konwertowania między datami bez przesunięcia strefy czasowej i ciągów. Na przykład "yyyy-MM-dd HH:mm:ss.fff".
Format dateTimeOffset Formatuj ciąg podczas konwertowania między datami z przesunięciem strefy czasowej i ciągami. Na przykład "yyyy-MM-dd HH:mm:ss.fff zzz".
Format przedziału czasu Formatuj ciąg podczas konwertowania między okresami i ciągami. Na przykład "dd.hh:mm:ss".
Kultury Informacje o kulturze, które mają być używane podczas konwertowania typów. Na przykład "en-us", "fr-fr".

Konfigurowanie innych ustawień na karcie Ustawienia

Karta Ustawienia zawiera ustawienia wydajności, przemieszczania itd.

Screenshot of Settings tab.

Aby zapoznać się z opisem każdego ustawienia, zobacz poniższą tabelę.

Ustawienie opis
Optymalizacja inteligentnej przepływności Określ, aby zoptymalizować przepływność. Możesz wybrać jedną z opcji:
Auto
Standardowa
Zrównoważone
Maksimum
Po wybraniu opcji Automatycznie optymalne ustawienie jest stosowane dynamicznie na podstawie pary źródłowej i wzorca danych. Możesz również dostosować przepływność, a wartość niestandardowa może wynosić od 2 do 256, a wyższa wartość oznacza więcej zysków.
Stopień równoległości kopiowania Określ stopień równoległości używany przez ładowanie danych.
Odporność na uszkodzenia Podczas wybierania tej opcji można zignorować niektóre błędy występujące w trakcie procesu kopiowania. Na przykład niezgodne wiersze między magazynem źródłowym i docelowym, plik usuwany podczas przenoszenia danych itp.
Włączanie rejestrowania Podczas wybierania tej opcji można rejestrować skopiowane pliki, pomijane pliki i wiersze
Włączanie przemieszczania Określ, czy chcesz skopiować dane za pośrednictwem tymczasowego magazynu przejściowego. Włącz przemieszczanie tylko w przypadku korzystnych scenariuszy.
Połączenie konta przejściowego Po wybraniu pozycji Włącz przemieszczanie określ połączenie źródła danych usługi Azure Storage jako tymczasowego magazynu przejściowego. Wybierz pozycję + Nowy , aby utworzyć połączenie przejściowe, jeśli go nie masz.

Konfigurowanie parametrów w działaniu kopiowania

Parametry mogą służyć do kontrolowania zachowania potoku i jego działań. Możesz użyć opcji Dodaj zawartość dynamiczną, aby określić parametry właściwości działania kopiowania. Określmy usługę Lakehouse/Data Warehouse/KQL Database jako przykład, aby zobaczyć, jak z niej korzystać.

  1. W źródle lub miejscu docelowym po wybraniu pozycji Obszar roboczy jako typ magazynu danych i specyfikacji Lakehouse Data Warehouse/KQL Database jako typu magazynu danych obszaru roboczego wybierz pozycję Dodaj zawartość dynamiczną na liście rozwijanejlakehouse/lub Data Warehouse lub KQL Database.

  2. W okienku podręcznym Dodaj zawartość dynamiczną w obszarze Parametry wybierz pozycję +.

    Screenshot showing the Add dynamic content page.

  3. Określ nazwę parametru i nadaj mu wartość domyślną, jeśli chcesz, lub możesz określić wartość parametru po wybraniu pozycji Uruchom w potoku.

    Screenshot shows creating a new parameter.

    Należy pamiętać, że wartość parametru powinna mieć identyfikator obiektu Lakehouse/Data Warehouse/KQL Database. Aby uzyskać identyfikator obiektu bazy danych Lakehouse/Data Warehouse/KQL, otwórz bazę danych Lakehouse/Data Warehouse/KQL w obszarze roboczym, a identyfikator znajduje się po /lakehouses/lub /datawarehouses/ w /databases/ adresie URL.

    • Identyfikator obiektu Lakehouse:

      Screenshot showing the Lakehouse object ID.

    • Identyfikator obiektu magazynu danych:

      Screenshot showing the Data Warehouse object ID.

    • Identyfikator obiektu bazy danych KQL:

      Screenshot showing the KQL Database object ID.

  4. Wybierz pozycję Zapisz, aby wrócić do okienka Dodawanie zawartości dynamicznej. Następnie wybierz parametr, aby był wyświetlany w polu wyrażenia. Następnie wybierz opcję OK. Wrócisz do strony potoku i zobaczysz, że wyrażenie parametru jest określone po identyfikatorze obiektu magazynu danych usługi Lakehouse o identyfikatorze// obiektu KQL Database.

    Screenshot showing selecting parameter.

Następne kroki