Gerir runtimes de integração
No Data Factory, as atividades definem as ações que vão ser realizadas. Os serviços ligados definem um arquivo de dados ou um serviço de computação de destino. Um tempo de execução de integração fornece a infraestrutura para a atividade e os serviços vinculados.
O Integration Runtime é referenciado pelo serviço ou atividade vinculado e fornece o ambiente de computação no qual a atividade é executada ou despachada. Desta forma, a atividade pode ser realizada na região mais perto possível do arquivo de dados ou do serviço de computação de destino com o melhor desempenho possível, satisfazendo as necessidades de segurança e conformidade.
Em resumo, o Integration Runtime (IR) é a infraestrutura de computação usada pelo Azure Data Factory. Ele fornece os seguintes recursos de integração de dados em diferentes ambientes de rede, incluindo:
- Fluxo de Dados: execute um Fluxo de Dados no ambiente de computação gerenciado do Azure.
- Movimentação de dados: copie dados entre armazenamentos de dados em rede pública e armazenamentos de dados em rede privada (rede local ou virtual privada). Oferece suporte para conectores incorporados, conversão de formatos, mapeamento de colunas e transferência de dados dimensionável e de desempenho elevado.
- Despacho de atividades: despache e monitore atividades de transformação em execução em uma variedade de serviços de computação, como Azure Databricks, Azure HDInsight, Azure Machine Learning, Banco de Dados SQL do Azure, SQL Server e muito mais.
- Execução de pacotes do SSIS: executar, nativamente, pacotes do SQL Server Integration Services (SSIS) num ambiente de computação gerida do Azure.
Sempre que uma instância do Azure Data Factory é criada, é criado um ambiente de Tempo de Execução de Integração padrão que dá suporte a operações em armazenamentos de dados em nuvem e serviços de computação em rede pública. Isso pode ser visualizado quando o tempo de execução da integração é definido como Auto-Resolve
Tipos de runtimes de integração
O Data Factory oferece três tipos de runtimes de integração e deve escolher aquele que melhor se adequa às capacidades de integração de dados e às necessidades de ambiente de rede de que está à procura. Estes três tipos são:
- Azure
- Autoalojado
- Azure-SSIS
Você pode definir explicitamente a configuração Integration Runtime na propriedade connectVia , se isso não estiver definido, o Integration Runtime padrão será usado com a propriedade definida como Auto-Resolve.
A tabela seguinte descreve as capacidades e o suporte de rede para cada um dos tipos de runtimes de integração:
Tipo de RI | Rede pública | Rede privada |
---|---|---|
Azure | Fluxo de Dados | Fluxo de Dados |
Movimento de dados | Movimento de dados | |
Despacho de Atividade | Despacho de Atividade | |
Autoalojado | Movimento de dados | Movimento de dados |
Distribuição de atividades | Distribuição de atividades | |
Azure-SSIS | Execução de pacotes do SSIS | Execução de pacotes do SSIS |
Determinando qual tempo de execução de integração usar
Há uma série de fatores que afetam o Integration Runtime que você usará. A seguir está um guia que irá ajudá-lo a selecionar o IR certo
Atividade Copiar
Para a atividade Copiar, ela requer serviços vinculados de origem e coletor para definir a direção do fluxo de dados. É utilizada a lógica seguinte para determinar que instância do runtime de integração é utilizada para fazer a cópia:
Copiar entre duas origens de dados na cloud: quando ambos os serviços ligados de origem e de sink estiverem a utilizar o IR do Azure, o ADF utiliza o IR do Azure regional, se tiver sido especificado ou determina automaticamente uma localização do IR do Azure se escolher a resolução automática (predefinição) conforme descrito na secção de Localização do runtime de integração.
Copiar entre uma origem de dados na cloud e uma origem de dados numa rede privada: se o serviço ligado de origem ou sink apontar para um runtime de integração autoalojado, a atividade Cópia é executada no mesmo.
Cópia entre duas fontes de dados na rede privada: o Serviço vinculado à origem e ao coletor deve apontar para a mesma instância do tempo de execução da integração, e esse tempo de execução da integração é usado para executar a Atividade de cópia.
Atividade de Pesquisa e GetMetadata
A atividade de Pesquisa e de GetMetadata é executada no runtime de integração associado ao serviço ligado ao arquivo de dados.
Atividade de transformação
Cada atividade de transformação tem um Serviço Ligado de destino, que aponta para um runtime de integração. É a partir desta instância de runtime de integração que a atividade de transformação é distribuída.
Atividade de fluxo de dados
A atividade de fluxo de dados é executada no tempo de execução de integração associado a ela.