Tarefa do Azure Data Lake Analytics
Aplica-se a: SQL Server SSIS Integration Runtime no Azure Data Factory
Com a tarefa do Azure Data Lake Analytics, é possível enviar trabalhos U-SQL para o serviço Azure Data Lake Analytics. Essa tarefa é um componente do feature pack para Azure do SSIS (SQL Server Integration Services).
Para obter informações gerais, consulte Azure Data Lake Analytics.
Importante
O Azure Data Lake Analytics será desativado em 29 de fevereiro de 2024. Saiba mais nesse comunicado.
Configurar a tarefa
Para adicionar uma tarefa do Azure Data Lake Analytics a um pacote, arraste-a da Caixa de Ferramentas do SSIS para a tela do designer. Clique duas vezes na tarefa, ou clique com o botão direito na tarefa, e selecione Editar. A caixa de diálogo Editor de tarefas do Azure Data Lake Analytics é aberta. Você pode definir as propriedades por meio do Designer SSIS ou programaticamente.
Configuração de página geral
Use a página Geral para configurar a tarefa e fornecer o script U-SQL que a tarefa envia. Para saber mais sobre a linguagem U-SQL, confira Referência da linguagem U-SQL.
Configuração básica
É possível especificar o nome e a descrição da tarefa.
Configuração do U-SQL
A configuração de U-SQL tem duas configurações: SourceType e as opções dinâmicas com base no valor de SourceType.
SourceType especifica a origem do script U-SQL. O script será enviado a uma conta do Azure Data Lake Analytics durante a execução do pacote do SSIS. As opções para essa propriedade são:
Valor | DESCRIÇÃO |
---|---|
DirectInput | Especifica o script U-SQL por meio do editor embutido. A seleção desse valor exibe a opção dinâmica USQLStatement. |
FileConnection | Especifica um arquivo. usql local que contém o script U-SQL. A seleção dessa opção exibe a opção dinâmica FileConnection. |
Variável | Especifica uma variável SSIS que contém o script U-SQL. Selecionando esse valor, a opção dinâmica SourceVariableé exibida. |
Opções Dinâmicas de SourceType especifica o conteúdo de script para a consulta U-SQL.
SourceType | Opções dinâmicas |
---|---|
SourceType = DirectInput | Digite a consulta U-SQL a ser enviada diretamente na caixa de opção ou selecione o botão Procurar (...) para digitar a consulta U-SQL na caixa de diálogo Digitar a consulta U-SQL. |
SourceType = FileConnection | Selecione um gerenciador de conexões de arquivo existente ou selecione <Nova conexão...> para criar uma nova conexão de arquivo. Para obter informações relacionadas, confira Gerenciador de Conexões de Arquivos e Editor do Gerenciador de Conexões de Arquivos. |
SourceType = Variable | Selecione uma variável existente ou selecione <Nova variável...> para criar uma nova variável. Para saber mais, confira Variáveis do SSIS (Integration Services) e Adicionar Variável. |
Configuração do trabalho
A configuração de trabalho especifica as propriedades de envio do trabalho de U-SQL.
AzureDataLakeAnalyticsConnection: Especifica a conta do Data Lake Analytics em que o script U-SQL é enviado. Escolha a conexão a partir de uma lista definida de gerenciadores de conexões. Para criar uma nova conexão, selecione <Nova conexão>. Para obter informações relacionadas, confira Gerenciador de Conexões do Azure Data Lake Analytics.
JobName: especifica o nome do trabalho U-SQL.
AnalyticsUnits: especifica a contagem de unidades de análise do trabalho U-SQL.
Priority: especifica a prioridade do trabalho U-SQL. Defina com um valor de 0 a 1000. Quanto menor o número, maior a prioridade.
RuntimeVersion: especifica a versão de tempo de execução do Data Lake Analytics do trabalho U-SQL. Ele é definido como "padrão" por padrão. Normalmente, você não precisa alterar essa propriedade.
Synchronous: um valor booliano que especifica se a tarefa deve aguardar a conclusão do trabalho ou não. Se o valor for definido como true, a tarefa será marcada como sucesso após a conclusão do trabalho. Se o valor for definido como false, a tarefa será marcada como sucesso após o trabalho passar pela fase de preparação.
Valor Descrição True O resultado da tarefa baseia-se no resultado de execução do trabalho U-SQL. Trabalho bem-sucedido > tarefa bem-sucedida. Falha do trabalho > falha na tarefa. Falha ou sucesso da tarefa > a tarefa é concluída. Falso O resultado da tarefa baseia-se no resultado de envio e preparação do trabalho U-SQL. Envio do trabalho bem-sucedido e fase de preparação realizada > tarefa bem-sucedida. Falha no envio do trabalho ou reprovação do trabalho na fase de preparação > falha na tarefa. Falha ou sucesso da tarefa > a tarefa é concluída. TimeOut: especifica um tempo limite em segundos para a execução do trabalho. Se o trabalho atingir o tempo limite, será cancelado e marcado como com falha. A propriedade não estará disponível se Synchronous for definido como falso.
Configuração de página de mapeamento de parâmetro
Use a página Mapeamento de Parâmetros da caixa de diálogo Editor de Tarefa do Azure Data Lake Analytics para mapear variáveis para parâmetros (variáveis de U-SQL) no script U-SQL.
Nome da Variável: Depois de adicionar um mapeamento de parâmetros selecionando Adicionar, selecione um sistema ou variável definida pelo usuário na lista. Como alternativa, você pode selecionar <Nova variável...> para adicionar uma nova variável usando a caixa de diálogo Adicionar Variável. Para saber mais, confira Variáveis do SSIS (Integration Services).
Nome do Parâmetro: forneça um nome de parâmetro/variável no script U-SQL. Verifique se o nome do parâmetro começa com o sinal @, como @Param1.
Aqui está um exemplo de como passar parâmetros para o script U-SQL.
Exemplo de script U-SQL
@searchlog =
EXTRACT UserId int,
Start DateTime,
Region string,
Query string,
Duration int,
Urls string,
ClickedUrls string
FROM @in
USING Extractors.Tsv(nullEscape:"#NULL#");
@rs1 =
SELECT Start, Region, Duration
FROM @searchlog
WHERE Region == "en-gb";
@rs1 =
SELECT Start, Region, Duration
FROM @rs1
WHERE Start <= DateTime.Parse("2012/02/19");
OUTPUT @rs1
TO @out
USING Outputters.Tsv(quoting:false, dateTimeFormat:null);
No exemplo de script acima, os caminhos de entrada e saída são definidos em parâmetros @in e @out. Os valores para os parâmetros @in e @out no script U-SQL são passados dinamicamente pela configuração de mapeamento de parâmetros.
Nome da variável | Nome do parâmetro |
---|---|
Usuário: Variável1 | @in |
Usuário: Variável2 | @out |
Configuração de página de expressão
É possível atribuir todas as propriedades na configuração de página Geral como uma expressão de propriedade para habilitar a atualização dinâmica da propriedade em runtime. Para obter informações relacionadas, confira Usar expressões de propriedade em pacotes.