Tarefa do Azure Synapse Analytics

Aplica-se a:SQL Server SSIS Integration Runtime no Azure Data Factory

A Tarefa do Azure Synapse Analytics habilita um pacote do SSIS a copiar dados de tabela para o pool de SQL dedicado do Azure Synapse Analytics do sistema de arquivos ou do Armazenamento de Blobs do Azure. A tarefa aproveita o PolyBase para melhorar o desempenho, conforme descrito no artigo Estratégias e padrões de carregamento do Azure Synapse Analytics. O formato de arquivo de dados de origem com suporte atualmente é texto delimitado em codificação UTF8. Ao copiar do sistema de arquivos, primeiro os dados serão carregados no Armazenamento de Blobs do Azure para o preparo e, depois, para o pool de SQL dedicado. Portanto, é necessário uma conta de Armazenamento de Blobs do Azure.

Observação

Não há suporte para o gerenciador de conexões do Armazenamento do Azure com o tipo de serviço do Data Lake Gen2.

Para usar o Azure Data Lake Gen2 para preparo ou origem, você pode se conectar por meio do gerenciador de conexões do Armazenamento do Azure com o tipo Armazenamento de Blobs do Azure.

A Tarefa do Azure Synapse Analytics é um componente do Feature Pack do SSIS (SQL Server Integration Services) para Azure.

Para adicionar uma Tarefa do Azure Synapse Analytics, arraste-a da Caixa de Ferramentas do SSIS e solte-a na tela do designer, então clique duas vezes ou clique com o botão direito do mouse em Editar para ver a caixa de diálogo Editor da Tarefa.

Na página Geral , defina as propriedades a seguir.

SourceType especifica o tipo de armazenamento de dados de origem. Selecione um dos seguintes tipos:

  • FileSystem: dados de origem residem no sistema de arquivos local.
  • BlobStorage: Dados de origem residem no Armazenamento de Blobs do Azure.

A seguir, as propriedades para cada tipo de fonte.

FileSystem

Campo DESCRIÇÃO
LocalDirectory Especifica o diretório local que contém os arquivos de dados a serem carregados.
Recursivamente Especifica se os subdiretórios devem ser pesquisados recursivamente.
FileName Especifica um filtro de nome para selecionar arquivos com o padrão de nome determinado. Por exemplo, MySheet*.xsl* incluirá arquivos como MySheet001.xsl e MySheetABC.xslx.
RowDelimiter Especifica os caracteres que marcam o final de cada linha.
ColumnDelimiter Especifica um ou mais caracteres que marcam o final de cada coluna. Por exemplo, | (barra vertical) \t (tabulação), ' (aspa simples), "(aspas duplas) e 0x5c (barra invertida).
IsFirstRowHeader Especifica se a primeira linha em cada arquivo de dados contém nomes de coluna em vez de dados reais.
AzureStorageConnection Especifica um gerenciador de conexões do Armazenamento do Azure.
BlobContainer Especifica o nome do contêiner de blob no qual os dados locais serão carregados e retransmitidos ao pool de SQL dedicado do Azure Synapse Analytics através do PolyBase. Um novo contêiner será criado, caso não exista.
BlobDirectory Especifica o diretório de blob (estrutura hierárquica virtual) no qual os dados locais serão carregados e retransmitidos ao pool de SQL dedicado do Azure Synapse Analytics através do PolyBase.
RetainFiles Especifica se os arquivos carregados no Armazenamento do Azure serão mantidos.
CompressionType Especifica o formato de compactação a ser usado ao carregar arquivos no Armazenamento do Azure. A origem local não é afetada.
CompressionLevel Especifica o nível de compactação a ser usado para o formato de compactação.
SqlPoolConnection Especifica um gerenciador de conexões ADO.NET para o pool de SQL dedicado do Azure Synapse Analytics.
TableName Especifica o nome da tabela de destino. Escolha um nome de tabela existente ou crie uma nova tabela escolhendo <Nova Tabela...>.
TableDistribution Especifica o método de distribuição para a nova tabela. Aplica-se caso um novo nome de tabela para TableNameseja especificado.
HashColumnName Especifica a coluna usada para a distribuição da tabela de hash. Aplica-se caso HASH for especificado para TableDistribution.

BlobStorage

Campo DESCRIÇÃO
AzureStorageConnection Especifica um gerenciador de conexões do Armazenamento do Azure.
BlobContainer Especifica o nome do contêiner de blob em que os dados de origem residem.
BlobDirectory Especifica o diretório de blobs (estrutura hierárquica virtual) em que os dados de origem residem.
RowDelimiter Especifica os caracteres que marcam o final de cada linha.
ColumnDelimiter Especifica um ou mais caracteres que marcam o final de cada coluna. Por exemplo, | (barra vertical) \t (tabulação), ' (aspa simples), "(aspas duplas) e 0x5c (barra invertida).
CompressionType Especifica o formato de compactação usado para dados de origem.
SqlPoolConnection Especifica um gerenciador de conexões ADO.NET para o pool de SQL dedicado do Azure Synapse Analytics.
TableName Especifica o nome da tabela de destino. Escolha um nome de tabela existente ou crie uma nova tabela escolhendo <Nova Tabela...>.
TableDistribution Especifica o método de distribuição para a nova tabela. Aplica-se caso um novo nome de tabela para TableNameseja especificado.
HashColumnName Especifica a coluna usada para a distribuição da tabela de hash. Aplica-se caso HASH for especificado para TableDistribution.

Você verá uma página Mapeamentos diferente caso esteja copiando para uma tabela nova ou para uma tabela existente. No primeiro caso, configure quais colunas de origem serão mapeadas e os nomes correspondentes na tabela de destino a ser criada. No último caso, configure as relações de mapeamento entre colunas de origem e de destino.

Na página Colunas , configure as propriedades de tipo de dados para cada coluna de origem.

A página T-SQL mostra o T-SQL usado para carregar os dados do Armazenamento de Blobs do Azure para o pool de SQL dedicado. O T-SQL é gerado automaticamente de configurações nas outras páginas e será executado como parte da execução da tarefa. Você pode optar por editar manualmente o T-SQL gerado para atender às suas necessidades específicas clicando no botão Editar . Depois, você pode reverter para aquele que foi gerado automaticamente, clicando no botão Redefinir .