Runtimes d’intégration

Effectué

Dans Data Factory, une activité désigne l’action à effectuer. Un service lié désigne un magasin de données cible ou un service de calcul. Un runtime d’intégration fournit l’infrastructure pour l’activité et les services liés.

Un runtime d’intégration est référencé par l’activité ou le service lié, et fournit l’environnement Compute dans lequel l’activité s’exécute ou depuis lequel elle est envoyée. L’activité peut être effectuée de la façon la plus efficace possible dans la région la plus proche du magasin de données cible ou du service de calcul, tout en respectant les exigences de conformité et de sécurité.

En bref, le runtime d’intégration (IR) est l’infrastructure de calcul utilisée par Azure Data Factory. Il fournit les fonctionnalités d’intégration de données suivantes dans les différents environnements réseau :

  • Data Flow : exécutez un Data Flow dans un environnement de calcul Azure managé.
  • Déplacement des données : copie des données entre les banques de données d’un réseau public et celles d’un réseau privé (sur un réseau privé local ou virtuel). Les connecteurs intégrés, la conversion de format, le mappage de colonnes, ainsi que les transferts de données performants et évolutifs sont pris en charge.
  • Répartition des activités : répartit et supervise les activités de transformation exécutées sur un large éventail de services de calcul, comme Azure Databricks, Azure HDInsight, Azure Machine Learning, Azure SQL Database, SQL Server, etc.
  • Exécution des packages SSIS : exécute en mode natif les packages SSIS (SQL Server Integration Services) dans un environnement Compute Azure managé.

Chaque fois qu’une instance d’Azure Data Factory est créée, un environnement de runtime d’intégration par défaut est créé pour prendre en charge les opérations sur les magasins de données cloud et les services de calcul dans un réseau public. Vous pouvez le voir quand le runtime d’intégration est configuré en résolution automatique.

Types de runtime d’intégration

Data Factory propose trois types de runtime d’intégration. Vous devez choisir le type qui répond le mieux à vos besoins en matière de fonctionnalités d’intégration de données et d’environnement réseau. Ces trois types sont :

  • Azure
  • Auto-hébergé
  • Azure-SSIS

Vous pouvez définir explicitement le paramètre Integration Runtime dans la propriété connectVia. S’il n’est pas défini, alors le runtime d’intégration par défaut est utilisé avec la propriété définie sur Résolution automatique.

Le tableau suivant décrit les fonctionnalités et l’environnement réseau pour chaque type de runtime d’intégration :

Type de runtime Réseau public Réseau privé
Azure Data Flow Data Flow
Déplacement des données Déplacement des données
Répartition des activités Répartition des activités
Auto-hébergé Déplacement des données Déplacement des données
Répartition des activités Répartition des activités
Azure-SSIS Exécution de package SSIS Exécution de package SSIS

Détermination du runtime d’intégration à utiliser

Il existe tout un éventail de facteurs qui affectent le runtime d’intégration que vous allez utiliser. Vous trouverez ci-dessous des informations pour vous aider à sélectionner le runtime d’intégration approprié.

Activité de copie

Dans le cas d’une activité Copy, les services liés source et récepteur doivent être indiqués pour définir la direction du flux de données. La logique suivante est utilisée pour déterminer l’instance de runtime d’intégration qui effectue la copie :

  • Copie entre deux sources de données cloud : lorsque les services liés source et du récepteur utilisent le runtime d'intégration Azure, ADF utilisera le runtime d'intégration Azure régional (si spécifié) ou déterminera automatiquement l’emplacement du runtime d'intégration Azure si vous avez choisi la résolution automatique du runtime d'intégration (par défaut) décrite dans la section Emplacement du runtime d'intégration.

  • Copie entre une source de données cloud et une source de données d’un réseau privé : si le service lié source ou récepteur pointe vers un runtime d’intégration auto-hébergé, l’activité de copie est exécutée sur ce runtime d’intégration.

  • Copie entre deux sources de données dans un réseau privé : les services liés source et récepteur doivent pointer vers la même instance du runtime d’intégration, et celui-ci est utilisé pour exécuter l’activité de copie.

Activité Lookup/GetMetadata

L’activité Lookup/GetMetadata est exécutée sur le runtime d'intégration associé au service lié de la banque de données.

Activités de transformation

Chaque activité de transformation a un service de calcul cible lié qui pointe vers un runtime d’intégration. Cette instance du runtime d’intégration se trouve au point d’envoi de l’activité de transformation.

Activité Data Flow

L’activité Data Flow est exécutée sur le runtime d’intégration qui lui est associé.