Origem de Arquivo Flexível

Aplica-se a:SQL Server SSIS Integration Runtime no Azure Data Factory

O componente Origem de Arquivo Flexível permite que um pacote do SSIS leia dados de vários serviços de armazenamento compatíveis. Os serviços de armazenamento compatíveis no momento são

Para ver o editor da Origem de Arquivo Flexível, arraste e solte a Origem de Arquivo Flexível no designer de fluxo de dados e clique duas vezes nele para abrir o editor.

A Origem de Arquivo Flexível é um componente do Feature Pack do SSIS (SQL Server Integration Services) para Azure.

As propriedades a seguir estão disponíveis no Editor de Origem de Arquivo Flexível.

  • Tipo de Arquivo do Gerenciador de Conexões: especifica o tipo do gerenciador de conexões de origem. Em seguida, escolha um já existente do tipo especificado ou crie um novo.
  • Caminho da Pasta: especifica o caminho da pasta de origem.
  • Nome de Arquivo: especifica o nome do arquivo de origem.
  • Formato do Arquivo: especifica o formato do arquivo de origem. Os formatos compatíveis são Text, Avro, ORC e Parquet. É necessário ter Java para ORC/Paquet. Confira aqui para obter detalhes.
  • Caractere delimitador de coluna: especifica o caractere usado como delimitador de coluna (delimitadores com vários caracteres não são compatíveis).
  • Primeira linha como nome da coluna: especifica se é necessário tratar a primeira coluna como nomes de coluna.
  • Descompactar o arquivo: especifica se é necessário descompactar o arquivo de origem.
  • Tipo de Compactação: especifica o formato de compactação do arquivo de origem. Os formatos compatíveis são GZIP, DEFLATE, BZIP2.

As propriedades a seguir estão disponíveis no Editor Avançado.

  • rowDelimiter: o caractere usado para separar linhas em um arquivo. É permitido somente um caractere. O valor padrão é \r\n.
  • escapeChar: o caractere especial usado para escapar um delimitador de coluna no conteúdo do arquivo de entrada. Não é possível especificar escapeChar e quoteChar para uma tabela. É permitido somente um caractere. Sem valor padrão.
  • quoteChar: o caractere usado para colocar um valor de cadeia de caracteres entre aspas. Os delimitadores de coluna e linha que ficam dentro dos caracteres de aspas seriam tratados como parte do valor da cadeia de caracteres. Essa propriedade se aplica aos conjuntos de dados de entrada e de saída. Não é possível especificar escapeChar e quoteChar para uma tabela. É permitido somente um caractere. Sem valor padrão.
  • nullValue: um ou mais caracteres usados para representar um valor nulo. O valor padrão é \N.
  • encodingName: especifica o nome de codificação. Confira a propriedade Encoding.EncodingName.
  • skipLineCount: indica o número de linhas não vazias a serem ignoradas ao ler dados dos arquivos de entrada. Se skipLineCount e firstRowAsHeader forem especificados, primeiro as linhas serão ignoradas e, em seguida, as informações de cabeçalho serão lidas no arquivo de entrada.
  • treatEmptyAsNull: especifica se é necessário tratar uma cadeia de caracteres nula ou vazia como um valor nulo ao ler dados de um arquivo de entrada. O valor padrão é True.

Depois de especificar as informações de conexão, alterne para a página Colunas para mapear colunas de origem para colunas de destino para o fluxo de dados do SSIS.

Observações sobre a configuração de permissão da entidade de serviço

Para que a conexão de teste funcione (armazenamento de blobs ou Data Lake Storage Gen2), a entidade de serviço deve ser atribuída pelo menos à função de Leitor de Dados do Storage Blob para a conta de armazenamento. Isso é feito com o RBAC.

Para o armazenamento de blobs, a permissão de leitura é concedida por meio da atribuição de pelo menos a função de Leitor de dados do blob de armazenamento.

Para o Azure Data Lake Storage Gen2, a permissão é determinada pelo RBAC e pelas ACLs. Preste atenção nas ACLs que são configuradas usando a OID (ID de objeto) da entidade de serviço para o registro do aplicativo, conforme detalhado aqui. Isso é diferente da ID do aplicativo (cliente) que é usada com a configuração de RBAC. Quando uma entidade de segurança recebe permissões de dados RBAC por meio de uma função interna ou por meio de uma função personalizada, essas permissões são avaliadas primeiro após a autorização de uma solicitação. Se a operação solicitada for autorizada pelas atribuições de RBAC da entidade de segurança, a autorização será imediatamente resolvida e nenhuma verificação de ACL adicional será executada. Como alternativa, se a entidade de segurança não tiver uma atribuição de RBAC ou se a operação da solicitação não corresponder à permissão atribuída, as verificações de ACL serão executadas para determinar se a entidade de segurança está autorizada a executar a operação solicitada. Para a permissão de leitura, conceda pelo menos a permissão de execução no sistema de arquivos de origem, juntamente com a permissão de Leitura para os arquivos a serem lidos. Como alternativa, conceda pelo menos a função de Leitor de dados do blob de armazenamento com RBAC. Consulte este artigo para obter detalhes.