Zarządzanie środowiskami Integration Runtime

Ukończone

W usłudze Data Factory działanie definiuje akcję do wykonania. Połączona usługa definiuje docelowy magazyn danych lub usługę obliczeniową. Środowisko Integration Runtime zapewnia infrastrukturę dla działań i połączonych usług.

Środowisko Integration Runtime jest przywoływane przez połączoną usługę lub działanie i udostępnia środowisko obliczeniowe, w którym działanie jest uruchamiane lub wysyłane. Dzięki temu działanie można wykonać w regionie najbliższym docelowemu magazynowi danych lub usłudze obliczeniowej, w sposób najbardziej wydajny, jednocześnie spełniając wymagania dotyczące zabezpieczeń i zgodności.

Krótko mówiąc, środowisko Integration Runtime (IR) to infrastruktura obliczeniowa używana przez usługę Azure Data Factory. Zapewnia następujące możliwości integracji danych w różnych środowiskach sieciowych, w tym:

  • Przepływ danych: wykonaj Przepływ danych w zarządzanym środowisku obliczeniowym platformy Azure.
  • Przenoszenie danych: kopiowanie danych między magazynami danych w sieci publicznej i magazynach danych w sieci prywatnej (lokalna lub wirtualna sieć prywatna). Zapewnia obsługę wbudowanych łączników, konwersji formatów i mapowania kolumn oraz wydajne i skalowalne przenoszenie danych.
  • Wysyłanie działań: wysyłanie i monitorowanie działań przekształcania uruchomionych w różnych usługach obliczeniowych, takich jak Azure Databricks, Azure HDInsight, Azure Machine Edukacja, Azure SQL Database, SQL Server i inne.
  • Wykonanie pakietów SSIS: natywne wykonywanie pakietów SQL Server Integration Services (SSIS) w zarządzanym środowisku obliczeniowym platformy Azure.

Za każdym razem, gdy zostanie utworzone wystąpienie usługi Azure Data Factory, zostanie utworzone domyślne środowisko Integration Runtime, które obsługuje operacje na magazynach danych w chmurze i usługach obliczeniowych w sieci publicznej. Można to wyświetlić, gdy środowisko Integration Runtime jest ustawione na Auto-Resolve

Typy infrastruktury Integration Runtime

Usługa Data Factory oferuje trzy typy infrastruktury Integration Runtime. Należy wybrać typ najlepiej odpowiadający poszukiwanym możliwościom integracji danych i potrzebom środowiska sieciowego. Te trzy typy to:

  • Azure
  • Samodzielne hostowanie
  • Azure-SSIS

Możesz jawnie zdefiniować ustawienie środowiska Integration Runtime we właściwości connectVia , jeśli nie jest to zdefiniowane, domyślne środowisko Integration Runtime jest używane z właściwością ustawioną na Auto-Resolve.

W poniższej tabeli opisano możliwości i obsługę sieci dla każdego typu infrastruktury Integration Runtime:

Typ środowiska IR Sieć publiczna Sieć prywatna
Azure Przepływ danych Przepływ danych
Przenoszenie danych Przenoszenie danych
Wysyłanie działań Wysyłanie działań
Samodzielne hostowanie Przenoszenie danych Przenoszenie danych
Wysyłanie działania Wysyłanie działania
Azure-SSIS Wykonanie pakietu SSIS Wykonanie pakietu SSIS

Określanie, które środowisko Integration Runtime ma być używane

Istnieje szereg czynników, które mają wpływ na środowisko Integration Runtime, którego będziesz używać. Poniżej przedstawiono przewodnik, który pomoże Ci wybrać odpowiednie środowisko IR

Działanie kopiowania

W przypadku działanie Kopiuj wymaga ona połączonych usług źródłowych i ujścia w celu zdefiniowania kierunku przepływu danych. Poniższa logika jest stosowana do określenia, które wystąpienie środowiska IR jest używane do wykonania kopii:

  • Kopiowanie między dwoma źródłami danych w chmurze: jeśli zarówno połączona usługa źródła, jak i ujścia używają środowiska IR Azure, usługa ADF użyje regionalnego środowiska IR Azure (jeśli zostało określone) lub automatycznie określi lokalizację środowiska IR Azure, jeśli wybrano opcję automatycznego określania środowiska IR, co jest ustawieniem domyślnym. Opisano to w sekcji Lokalizacja środowiska Integration Runtime.

  • Kopiowanie między źródłem danych w chmurze i źródłem danych w sieci prywatnej: jeśli połączona usługa źródła lub ujścia wskazuje środowisko IR (Self-hosted), działanie kopiowania jest wykonywane w tym środowisku IT (Self-hosted).

  • Kopiowanie między dwoma źródłami danych w sieci prywatnej: zarówno źródło, jak i połączona usługa ujścia muszą wskazywać to samo wystąpienie środowiska Integration Runtime, a środowisko Integration Runtime jest używane do wykonywania działania kopiowania.

Działanie wyszukiwania i uzyskiwania metadanych

Działanie wyszukiwania i uzyskiwania metadanych jest wykonywane w środowisku Integration Runtime skojarzonym z połączoną usługą magazynu danych.

Działanie przekształcania

Każde działanie przekształcania zawiera docelową obliczeniową usługę połączoną, która wskazuje infrastrukturę Integration Runtime. To wystąpienie infrastruktury Integration Runtime jest miejscem, z którego wysyłane jest działanie przekształcania.

działanie Przepływ danych

Przepływ danych działanie jest wykonywane w skojarzonym z nim środowisku Integration Runtime.