Compartilhar via


Configurar o Microsoft Integration Runtime do Azure-SSIS para alto desempenho

APLICA-SE A: Azure Data Factory Azure Synapse Analytics

Dica

Experimente o Data Factory no Microsoft Fabric, uma solução de análise tudo-em-um para empresas. O Microsoft Fabric abrange desde movimentação de dados até ciência de dados, análise em tempo real, business intelligence e relatórios. Saiba como iniciar uma avaliação gratuita!

Este artigo descreve como configurar um IR (Microsoft Integration Runtime) do Azure-SSIS para alto desempenho. O IR do Azure-SSIS permite que você implante e execute pacotes SSIS (SQL Server Integration Services) no Azure. Para obter mais informações sobre o IR do Azure-SSIS, consulte o artigo Integration Runtime. Para obter informações sobre como implantar e executar pacotes SSIS no Azure, consulte Método lift-and-shift de cargas de trabalho do SQL Server Integration Services para a nuvem.

Importante

Este artigo contém resultados de desempenho e observações de testes internos realizados por membros da equipe de desenvolvimento do SSIS. Os resultados podem variar. Faça seu próprio teste antes de finalizar suas configurações, o que afeta custo e desempenho.

Propriedades para configurar

A seguinte parte de um script de configuração mostra as propriedades que você pode configurar ao criar um Integration Runtime do Azure-SSIS. Para obter o script e a descrição completos do PowerShell, consulte Implantar pacotes do SQL Server Integration Services no Azure.

# If your input contains a PSH special character, e.g. "$", precede it with the escape character "`" like "`$"
$SubscriptionName = "[your Azure subscription name]"
$ResourceGroupName = "[your Azure resource group name]"
$DataFactoryName = "[your data factory name]"
# For supported regions, see https://azure.microsoft.com/global-infrastructure/services/?products=data-factory&regions=all
$DataFactoryLocation = "EastUS"

### Azure-SSIS integration runtime information - This is a Data Factory compute resource for running SSIS packages
$AzureSSISName = "[specify a name for your Azure-SSIS IR]"
$AzureSSISDescription = "[specify a description for your Azure-SSIS IR]"
# For supported regions, see https://azure.microsoft.com/global-infrastructure/services/?products=data-factory&regions=all
$AzureSSISLocation = "EastUS"
# For supported node sizes, see https://azure.microsoft.com/pricing/details/data-factory/ssis/
$AzureSSISNodeSize = "Standard_D8_v3"
# 1-10 nodes are currently supported
$AzureSSISNodeNumber = 2
# Azure-SSIS IR edition/license info: Standard or Enterprise
$AzureSSISEdition = "Standard" # Standard by default, while Enterprise lets you use advanced/premium features on your Azure-SSIS IR
# Azure-SSIS IR hybrid usage info: LicenseIncluded or BasePrice
$AzureSSISLicenseType = "LicenseIncluded" # LicenseIncluded by default, while BasePrice lets you bring your existing SQL Server license with Software Assurance to earn cost savings from Azure Hybrid Benefit (AHB) option
# For a Standard_D1_v2 node, up to 4 parallel executions per node are supported, but for other nodes, up to max(2 x number of cores, 8) are currently supported
$AzureSSISMaxParallelExecutionsPerNode = 8
# Custom setup info
$SetupScriptContainerSasUri = "" # OPTIONAL to provide SAS URI of blob container where your custom setup script and its associated files are stored
# Virtual network info: Classic or Azure Resource Manager
$VnetId = "[your virtual network resource ID or leave it empty]" # REQUIRED if you use Azure SQL Database with virtual network service endpoints/SQL Managed Instance/on-premises data, Azure Resource Manager virtual network is recommended, Classic virtual network will be deprecated soon
$SubnetName = "[your subnet name or leave it empty]" # WARNING: Please use the same subnet as the one used with your Azure SQL Database with virtual network service endpoints or a different subnet than the one used for your SQL Managed Instance

### SSISDB info
$SSISDBServerEndpoint = "[your server name or managed instance name.DNS prefix].database.windows.net" # WARNING: Please ensure that there is no existing SSISDB, so we can prepare and manage one on your behalf
# Authentication info: SQL or Azure Active Directory (AAD)
$SSISDBServerAdminUserName = "[your server admin username for SQL authentication or leave it empty for AAD authentication]"
$SSISDBServerAdminPassword = "[your server admin password for SQL authentication or leave it empty for AAD authentication]"
$SSISDBPricingTier = "[Basic|S0|S1|S2|S3|S4|S6|S7|S9|S12|P1|P2|P4|P6|P11|P15|…|ELASTIC_POOL(name = <elastic_pool_name>) for Azure SQL Database or leave it empty for SQL Managed Instance]"

AzureSSISLocation

AzureSSISLocation é o local para o nó de trabalho do runtime de integração. O nó de trabalho mantém uma conexão constante ao SSISDB (Banco de Dados do Catálogo SSIS) em um Banco de Dados SQL do Azure. Defina AzureSSISLocation para o mesmo local que o SQL Server lógico que hospeda o SSISDB, permitindo que o runtime de integração funcione tão eficientemente quanto possível.

AzureSSISNodeSize

Data Factory, incluindo o IR do Azure-SSIS, dá suporte às opções a seguir:

  • Standard_A4_v2
  • Standard_A8_v2
  • Standard_D1_v2
  • Standard_D2_v2
  • Standard_D3_v2
  • Standard_D4_v2
  • Standard_D2_v3
  • Standard_D4_v3
  • Standard_D8_v3
  • Standard_D16_v3
  • Standard_D32_v3
  • Standard_D64_v3
  • Standard_E2_v3
  • Standard_E4_v3
  • Standard_E8_v3
  • Standard_E16_v3
  • Standard_E32_v3
  • Standard_E64_v3

No teste interno não oficial da equipe de engenharia do SSIS, a série D mostra-se ser mais adequada para a execução do pacote SSIS do que a série A.

  • A taxa de desempenho/preço da série D é maior do que a da série A, e a taxa de desempenho/preço da série v3 é maior do que a da série v2.
  • A taxa de transferência da série D é maior do que a da série A com o mesmo preço, e a taxa de transferência da série v3 é maior do que a da série v2 pelo mesmo preço.
  • Os nós da série v2 do IR do Azure-SSIS IR não são adequados para a instalação personalizada, portanto, use os nós da série v3. Se você já utiliza os nós da série v2, alterne para os nós da série v3 assim que possível.
  • A série E tem tamanhos de VM otimizados para memória, com uma taxa maior de memória para CPU do que outras máquinas. Se o pacote exigir muita memória, considere escolher a VM da série E.

Configurar para velocidade de execução

Caso não tenha muitos pacotes para executar e deseja que os pacotes sejam executados rapidamente, utilize as informações no gráfico a seguir para escolher um tipo de máquina virtual adequado ao seu cenário.

Esses dados representam uma única execução de pacote em um nó de trabalho único. O pacote carrega 3 milhões de registros com as colunas de nome e sobrenome do Armazenamento de Blobs do Azure, gera uma coluna de nome completo e grava os registros que têm o nome completo com mais de 20 caracteres no Armazenamento de Blobs do Azure.

O eixo y é o número de pacotes que concluíram a execução em uma hora. Isso é apenas um resultado de teste de um pacote que consome memória. Caso você queira saber a taxa de transferência do pacote, é recomendável executar o teste por conta própria.

Velocidade de execução do pacote Integration Runtime do SSIS

Configurar a taxa de transferência geral

Caso você tenha muitos lotes de pacotes para executar, e se preocupa mais com a taxa de transferência geral, utilize as informações no gráfico a seguir para escolher um tipo de máquina virtual adequado ao seu cenário.

O eixo y é o número de pacotes que concluíram a execução em uma hora. Isso é apenas um resultado de teste de um pacote que consome memória. Caso você queira saber a taxa de transferência do pacote, é recomendável executar o teste por conta própria.

Taxa de transferência geral máxima do Integration Runtime do SSIS

AzureSSISNodeNumber

AzureSSISNodeNumber ajusta a escalabilidade do runtime de integração. A taxa de transferência do runtime de integração é proporcional ao AzureSSISNodeNumber. Primeiramente, defina AzureSSISNodeNumber para um valor pequeno, monitore a taxa de transferência do runtime de integração e, em seguida, ajuste o valor para o seu cenário. Para reconfigurar a contagem do nó de trabalho, consulte Gerenciar um runtime de integração do Azure-SSIS.

AzureSSISMaxParallelExecutionsPerNode

Quando você já estiver utilizando um nó de trabalho avançado para executar pacotes, aumentar o AzureSSISMaxParallelExecutionsPerNode poderá aumentar a taxa de transferência geral do runtime de integração. Se desejar aumentar o valor máximo, você precisará usar o Azure PowerShell para atualizar AzureSSISMaxParallelExecutionsPerNode. É possível estimar o valor apropriado com base no custo do pacote e nas seguintes configurações para os nós de trabalho. Para obter mais informações, consulte Tamanhos das máquinas virtuais para uso geral.

Tamanho vCPU Memória: GiB Armazenamento temporário (SSD) GiB Taxa de transferência máxima de armazenamento temporário: IOPS / MBps de leitura / MBps de gravação Discos de dados máximos / taxa de transferência: IOPS Máximo de NICs/Desempenho de rede esperado (Mbps)
Standard_D1_v2 1 3,5 50 3000 / 46 / 23 2 / 2 x 500 2 / 750
Standard_D2_v2 2 7 100 6000 / 93 / 46 4 / 4 x 500 2 / 1500
Standard_D3_v2 4 14 200 12000 / 187 / 93 8 / 8 x 500 4 / 3000
Standard_D4_v2 8 28 400 24000 / 375 / 187 16 / 16 x 500 8 / 6000
Standard_A4_v2 4 8 40 4000 / 80 / 40 8 / 8 x 500 4 / 1000
Standard_A8_v2 8 16 80 8000 / 160 / 80 16 / 16 x 500 8 / 2000
Standard_D2_v3 2 8 50 3000 / 46 / 23 4 / 6x500 2 / 1000
Standard_D4_v3 4 16 100 6000 / 93 / 46 8 / 12x500 2 / 2000
Standard_D8_v3 8 32 200 12000 / 187 / 93 16 / 24x500 4 / 4000
Standard_D16_v3 16 64 400 24000 / 375 / 187 32/ 48x500 8 / 8000
Standard_D32_v3 32 128 800 48000 / 750 / 375 32 / 96x500 8 / 16000
Standard_D64_v3 64 256 1600 96000 / 1000 / 500 32 / 192x500 8 / 30000
Standard_E2_v3 2 16 50 3000 / 46 / 23 4 / 6x500 2 / 1000
Standard_E4_v3 4 32 100 6000 / 93 / 46 8 / 12x500 2 / 2000
Standard_E8_v3 8 64 200 12000 / 187 / 93 16 / 24x500 4 / 4000
Standard_E16_v3 16 128 400 24000 / 375 / 187 32 / 48x500 8 / 8000
Standard_E32_v3 32 256 800 48000 / 750 / 375 32 / 96x500 8 / 16000
Standard_E64_v3 64 432 1600 96000 / 1000 / 500 32 / 192x500 8 / 30000

Aqui estão as diretrizes para definir o valor direito para a propriedade AzureSSISMaxParallelExecutionsPerNode:

  1. Primeiramente, defina-o para um valor pequeno.
  2. Aumente-o por em pequena quantidade para verificar se a taxa de transferência geral é aperfeiçoada.
  3. Pare de aumentar o valor quando a taxa de transferência geral atingir o valor máximo.

SSISDBPricingTier

SSISDBPricingTier é o tipo de preço para o SSISDB (Banco de dados do catálogo do SSIS) em um Banco de Dados SQL do Azure. Essa configuração afeta o número máximo de funções de trabalho na instância do IR, a velocidade para colocar na fila uma execução de pacote e a velocidade para carregar o log de execução.

  • Se você não se preocupar com a velocidade para colocar na fila a execução do pacote e para carregar o log de execução, você poderá escolher o menor tipo de preço do banco de dados. O banco de dados SQL do Azure com preço Básico fornece suporte a 8 funções de trabalho em uma instância de runtime de integração.

  • Escolha um banco de dados mais avançado do que Básico, se o número de funções de trabalho for superior a 8 ou a contagem do núcleo for superior a 50. Caso contrário, o banco de dados se torna o gargalo da instância de runtime de integração e o desempenho geral é impactado negativamente.

  • Escolha um banco de dados mais potente, como S3, se o nível de registros em log estiver definido como detalhado. De acordo com nosso teste interno não oficial, o tipo de preço S3 pode dar suporte para a execução do pacote SSIS com dois nós, 128 contagens paralelas e nível de registros em log detalhado.

Também é possível ajustar o tipo de preço do banco de dados com base nas informações de uso de DTU (unidade de transações do banco de dados) disponível no Portal do Azure.

Design para alto desempenho

Projetar um pacote SSIS para executar no Azure é diferente de projetar um pacote para execução local. Em vez de combinar várias tarefas independentes no mesmo pacote, separe-as em vários pacotes para uma execução mais eficiente no IR do Azure-SSIS. Crie uma execução de pacote para cada pacote, de modo que não precisem aguardar uns aos outros para concluir. Essa abordagem beneficia da escalabilidade do runtime de integração do Azure-SSIS e aprimora a taxa de transferência geral.

Saiba mais sobre o Microsoft Integration Runtime do Azure-SSIS. Consulte Microsoft Integration Runtime do Azure-SSIS.