統合ランタイムの管理
Data Factory で、アクティビティは、実行されるアクションを定義します。 リンクされたサービスは、ターゲットのデータ ストアやコンピューティング サービスを定義します。 統合ランタイムには、アクティビティおよびリンク サービスのインフラストラクチャが用意されています。
Integration Runtime は、リンク サービスまたはアクティビティによって参照され、アクティビティを実行したり、ディスパッチするコンピューティング環境が用意されています。 これにより、ターゲットのデータ ストアやコンピューティング サービスに可能な限り近いリージョンでアクティビティが実行されるので、効率を最大化できるとともに、セキュリティとコンプライアンスのニーズも満たせます。
つまり、Integration Runtime (IR) は、Azure Data Factory に使用されるコンピューティング インフラストラクチャです。 次のようなさまざまなネットワーク環境向けにデータ統合機能が提供されています。
- データ フロー: マネージド Azure コンピューティング環境でデータ フローを実行します。
- データ移動: パブリック ネットワーク内のデータ ストアとプライベート ネットワーク (オンプレミスまたは仮想プライベート ネットワーク) 内のデータ ストア間で、データ コピーを行ないます。 これにより、組み込みコネクタ、形式の変換、列のマッピング、パフォーマンスとスケーラビリティに優れたデータ転送に関するサポートが提供されます。
- アクティビティのディスパッチ: Azure Databricks、Azure HDInsight、Azure Machine Learning、Azure SQL Database、SQL Server などのさまざまなコンピューティング サービスで実行される変換アクティビティをディスパッチして監視します。
- SSIS パッケージの実行: マネージド Azure コンピューティング環境内で、SQL Server Integration Services (SSIS) パッケージをネイティブに実行します。
Azure Data Factory インスタンスが作成されるたびに、パブリック ネットワークのクラウド データ ストアとコンピューティング サービスに対する操作をサポートする既定の Integration Runtime 環境が作成されます。 これは、統合ランタイムが "自動解決" に設定されている場合に表示されます
統合ランタイムの種類
Data Factory には 3 種類の統合ランタイムが用意されているので、ご希望のデータ統合機能やネットワーク環境のニーズに最もかなっている種類を選択できます。 これらには次の 3 種類があります。
- 紺碧
- セルフホステッド
- Azure-SSIS
connectVia プロパティで Integration Runtime 設定を明示的に定義できます。これが定義されていない場合は、既定の統合ランタイムが使用され、プロパティは "自動解決" に設定されます。
次の表は、それぞれの統合ランタイムの機能とネットワークのサポートについて説明しています。
| IR の種類 | 公衆ネットワーク | プライベート ネットワーク |
|---|---|---|
| 紺碧 | Data Flow | Data Flow |
| データの移動 | データの移動 | |
| アクティビティのディスパッチ | アクティビティのディスパッチ | |
| セルフホステッド | データの移動 | データの移動 |
| アクティビティのディスパッチ | アクティビティのディスパッチ | |
| Azure-SSIS | SSIS パッケージの実行 | SSIS パッケージの実行 |
使用する統合ランタイムの決定
使用する統合ランタイムに影響するさまざまな要因があります。 適切な IR を選択するために役立つガイドを次に示します。
Copy アクティビティ
Copy アクティビティの場合、データ フローの方向を定義するのに、ソースとシンクのリンクされたサービスが必要です。 どの統合ランタイム インスタンスを使用してコピーを実行するかを決めるために、次のロジックが使用されます。
2 つのクラウド データ ソース間でのコピー: ソースとシンクのリンク サービスの両方で Azure IR を使用している場合、「統合ランタイムの場所」セクションで説明されているように、ADF は、指定がある場合はリージョンの Azure IR を使用し、自動解決 IR (既定) を選択した場合は、Azure IR の場所を自動決定します。
クラウド データ ソースとプライベート ネットワークのデータソース間のコピー: ソースまたはシンクのリンク サービスのどちらかがセルフホステッド IR を指している場合、コピー アクティビティはそのセルフホステッド統合ランタイムで実行されます。
プライベート ネットワーク内の 2 つのデータソース間でのコピー: ソースとシンクの両方がリンクされたサービスは、統合ランタイムの同じインスタンスを指している必要があり、その統合ランタイムを使用してコピー アクティビティが実行されます。
Lookup および GetMetadata アクティビティ
Lookup および GetMetadata アクティビティは、データ ストアのリンク サービスに関連付けられている統合ランタイム上で実行されます。
変換アクティビティ
各変換アクティビティには、ターゲット コンピューティングのリンク サービスがあり、これは統合ランタイムを指しています。 この統合ランタイム インスタンスは、変換アクティビティのディスパッチ元です。
データ フロー アクティビティ
Data Flow アクティビティは、それに関連付けられている統合ランタイム上で実行されます。