Kopiowanie lub klonowanie fabryki danych w Azure Data Factory

DOTYCZY: Azure Data Factory Azure Synapse Analytics

Napiwek

Data Factory w usłudze Microsoft Fabric jest następną generacją Azure Data Factory z prostszą architekturą, wbudowaną sztuczną inteligencją i nowymi funkcjami. Jeśli dopiero zaczynasz integrować dane, zacznij od Fabric Data Factory. Istniejące obciążenia usługi ADF można uaktualnić do Fabric, aby uzyskać dostęp do nowych funkcji w nauce o danych, analizie w czasie rzeczywistym i raportowaniu.

W tym artykule opisano sposób kopiowania lub klonowania fabryki danych w Azure Data Factory.

Zastosowania klonowania centrum danych

Oto niektóre okoliczności, w których warto skopiować lub sklonować fabrykę danych:

  • Przenieś Data Factory do nowego regionu. Jeśli chcesz przenieść fabrykę danych do innego regionu, najlepszym sposobem jest utworzenie kopii w regionie docelowym i usunięcie istniejącej.

  • Zmiana nazwy usługi Data Factory. Azure nie obsługuje zmiany nazw zasobów. Jeśli chcesz zmienić nazwę fabryki danych, możesz sklonować fabrykę danych o innej nazwie i usunąć istniejącą fabrykę danych.

  • Debugowanie zmienia się , gdy funkcje debugowania nie są wystarczające. W większości scenariuszy można użyć Debug. W innych przypadkach testowanie zmian w sklonowanym środowisku piaskownicy ma większy sens. Na przykład sposób działania sparametryzowanych potoków ETL w przypadku wyzwolenia wyzwalacza po nadejściu pliku w porównaniu z upływem przedziału czasu może nie być łatwe do testowania za pomocą samego debugowania. W takich przypadkach warto sklonować środowisko piaskownicy, aby móc eksperymentować. Azure Data Factory nalicza opłaty głównie na podstawie liczby uruchomień, więc druga instancja nie generuje dodatkowych opłat.

Jak sklonować fabrykę danych

  1. W ramach wymagań wstępnych należy najpierw utworzyć docelową fabrykę danych z poziomu portalu Azure.

  2. Jeśli jesteś w trybie GIT:

    1. Za każdym razem, gdy publikujesz w portalu, szablon Resource Manager fabryki jest zapisywany w usłudze GIT w gałęzi adf_publish
    2. Połącz nową fabrykę z tym samym repozytorium i skompiluj ją z gałęzi adf_publish. Zasoby, takie jak potoki, zestawy danych i wyzwalacze, będą przeniesione.
  3. Jeśli jesteś w trybie na żywo:

    1. Interfejs użytkownika usługi Data Factory umożliwia wyeksportowanie całego ładunku fabryki danych do pliku szablonu Resource Manager i pliku parametrów. Dostęp do nich można uzyskać za pomocą przycisku ARM template \ Eksportuj szablon Resource Manager w portalu.
    2. Możesz wprowadzić odpowiednie zmiany w pliku parametrów, wstawiając nowe wartości dla nowej fabryki.
    3. Następnie można wdrożyć go za pomocą standardowych metod wdrażania szablonów Resource Manager. Aby uzyskać szczegółowe instrukcje, zobacz Wdrażanie zasobów za pomocą szablonów ARM
  4. Jeśli masz w fabryce źródłowej SelfHosted Integration Runtime, musisz wstępnie utworzyć ją o tej samej nazwie w fabryce docelowej. Jeśli chcesz udostępnić SelfHosted Integration Runtime między różnymi fabrykami, możesz użyć wzorca opublikowanego tutaj na temat udostępniania własnego SelfHosted IR.

  5. Ze względów bezpieczeństwa wygenerowany szablon Resource Manager nie będzie zawierać żadnych informacji tajnych, na przykład haseł połączonych usług. W związku z tym należy podać poświadczenia jako parametry wdrożenia. Jeśli ręczne wprowadzanie poświadczeń nie jest zalecane w Twoich ustawieniach, rozważ pobranie ciągów połączenia i haseł z Azure Key Vault. Zobacz więcej

Zapoznaj się ze wskazówkami dotyczącymi tworzenia fabryki danych w portalu Azure w Tworzenie fabryki danych przy użyciu interfejsu użytkownika Azure Data Factory.