Gestire i runtime di integrazione

Completato

In Data Factory, un'attività definisce l'azione da eseguire. Un servizio collegato definisce un archivio dati o un servizio di calcolo di destinazione. Un runtime di integrazione fornisce l'infrastruttura per l'attività e i servizi collegati.

Il runtime di integrazione ha riferimenti nel servizio collegato o nell'attività e offre l'ambiente di calcolo in cui viene eseguita l'attività o da cui viene inviata. In questo modo, l'attività può essere eseguita nell'area più vicina possibile all'archivio dati o al servizio di calcolo di destinazione nel modo più efficiente soddisfacendo al contempo le esigenze di sicurezza e conformità.

In breve, il runtime di integrazione è l'infrastruttura di calcolo usata da Azure Data Factory. Fornisce le funzionalità di integrazione dei dati seguenti in diversi ambienti di rete, tra cui:

  • Flusso di dati: consente di eseguire un flusso di dati nell'ambiente di calcolo di Azure gestito.
  • Spostamento dati: consente di copiare dati tra gli archivi dati nella rete pubblica e gli archivi dati nella rete privata (ambiente locale o VPN). Fornisce il supporto per i connettori predefiniti, la conversione dei formati, il mapping di colonne e il trasferimento di dati scalabile e ad alte prestazioni.
  • Invio di attività: consente di inviare e monitorare le attività di trasformazione in esecuzione in diversi servizi di calcolo, come Azure Databricks, Azure HDInsight, Azure Machine Learning, il database SQL di Azure, SQL Server e altro ancora.
  • Esecuzione di pacchetti SSIS: eseguire in modo nativo i pacchetti SQL Server Integration Services (SSIS) in un ambiente di calcolo Azure gestito.

Ogni volta che viene creata un'istanza di Azure Data Factory, viene creato un ambiente di runtime di integrazione predefinito che supporta operazioni su archivi dati cloud e servizi di calcolo nella rete pubblica, ad esempio quando il runtime di integrazione è impostato su Auto-Resolve

Tipi di runtime di integrazione

Il servizio Data Factory offre tre tipi di runtime di integrazione; è consigliabile scegliere il tipo più adatto alle funzionalità di integrazione e ai requisiti dell'ambiente di rete desiderato. Questi tre tipi sono:

  • Azure
  • Self-hosted
  • Azure-SSIS

È possibile definire in modo esplicito l'impostazione del runtime di integrazione nella proprietà connectVia. Se la proprietà non è definita, viene usato il runtime di integrazione predefinito con la proprietà impostata su Auto-Resolve.

Nella tabella seguente vengono descritte le funzionalità e il supporto di rete per ogni tipo di runtime di integrazione:

Tipo di runtime di integrazione Rete pubblica Rete privata
Azure Flusso di dati Flusso di dati
Spostamento dati Spostamento dati
Invio di attività Invio di attività
Self-hosted Spostamento dati Spostamento dati
Invio di attività Invio di attività
Azure-SSIS Esecuzione pacchetti SSIS Esecuzione pacchetti SSIS

Determinazione del runtime di integrazione da usare

Esistono diversi fattori che influiscono sul runtime di integrazione che verrà usato. Di seguito è riportata una guida che consente di scegliere il runtime di integrazione corretto

Attività di copia

Per l'attività di copia sono necessari i servizi collegati di origine e sink per definire la direzione del flusso di dati. Per determinare l'istanza del runtime di integrazione usata per eseguire la copia, viene usata la logica seguente:

  • Copia tra due origini dati cloud: quando entrambi i servizi collegati (origine e sink) usano il runtime di integrazione di Azure, Azure Data Factory usa il runtime di integrazione di Azure dell'area, se specificato, oppure determina automaticamente una località del runtime di integrazione di Azure se si sceglie l'opzione di risoluzione automatica del runtime di integrazione (impostazione predefinita), come descritto nella sezione Località del runtime di integrazione.

  • Copia dei dati tra un'origine dati cloud e un'origine dati nella rete privata: se il servizio collegato di origine o sink punta a un runtime di integrazione self-hosted, l'attività di copia viene eseguita su questo runtime di integrazione self-hosted.

  • Copia tra due origini dati nella rete privata: sia il servizio collegato di origine che quello sink devono puntare alla stessa istanza del runtime di integrazione e questo runtime di integrazione viene usato per eseguire l'attività di copia.

Attività Lookup e GetMetadata

L'attività Lookup e GetMetadata viene eseguita sul runtime di integrazione associato al servizio collegato dell'archivio dati.

Attività di trasformazione

Ogni attività di trasformazione ha un servizio collegato di calcolo di destinazione che punta a un runtime di integrazione. Questa istanza del runtime di integrazione è la posizione da cui viene inviata l'attività di trasformazione.

Attività flusso di dati

L'attività del flusso di dati viene eseguita sul runtime di integrazione associato.