Como classificar dados para as Transformações Mesclar e Junção de Mesclagem
No Integration Services, as transformações Mesclar e Junção de Mesclagem requerem dados classificados para suas entradas. Os dados de entrada devem ser classificados fisicamente e as opções de classificação devem ser definidas nas saídas e nas colunas de saída na origem ou na transformação upstream. Se as opções de classificação indicarem que os dados estão classificados, mas os dados não estiverem efetivamente classificados, os resultados da operação de mesclagem ou junção de mesclagem são imprevisíveis.
Classificando os dados
Você pode classificar os dados usando um dos seguintes métodos:
Na origem, use uma cláusula de ORDER BY na instrução utilizada para carregar os dados.
No fluxo de dados, insira uma transformação Classificação antes da transformação Mesclar ou Junção de Mesclagem.
Se os dados forem dados de cadeia de caracteres, as transformações Mesclar e Junção de Mesclagem esperarão que os valores da cadeia de caracteres tenham sido classificados com o uso do agrupamento do Windows. Para fornecer valores de cadeia de caracteres às transformações Mesclar e Junção de Mesclagem classificadas com o uso do agrupamento do Windows, use o seguinte procedimento.
Para fornecer valores da cadeia de caracteres que são classificados usando agrupamento de Windows
Use uma transformação Classificação para classificar os dados.
A transformação Classificação usa o agrupamento do Windows para classificar valores de cadeia de caracteres.
—ou—
Primeiro use o operador CAST Transact-SQL para converter os valores varchar em valores nvarchar e, depois, use a cláusula ORDER BY Transact-SQL para classificar os dados.
Importante Não é possível usar a cláusula ORDER BY sozinha porque ela utiliza um agrupamento do SQL Server para classificar valores de cadeia de caracteres. O uso do agrupamento do SQL Server pode resultar em uma ordem de classificação diferente do agrupamento do Windows, o que pode fazer com que a transformação Mesclar ou Junção de Mesclagem produza resultados inesperados.
Definindo opções de classificação nos dados
Há duas propriedades de classificação importantes que devem ser definidas para a transformação de origem ou upstream que fornece dados às transformações Mesclar e Junção de Mesclagem:
A propriedade IsSorted da saída que indica se os dados foram classificados. Essa propriedade deve ser definida como True.
Importante Definir o valor da propriedade IsSorted como True não classifica os dados. Esta propriedade apenas fornece uma dica aos componentes downstream de que os dados foram classificados previamente.
A propriedade SortKeyPosition das colunas de saída que indica se uma coluna está classificada, a ordem de classificação da coluna e a sequência na qual várias colunas são classificadas. Esta propriedade deve ser definida para cada coluna de dados classificados.
Se você usar a transformação Classificação para classificar os dados, essa transformação define ambas as propriedades como necessárias para a transformação Mesclar ou Junção de Mesclagem. Ou seja, a transformação Classificação define a propriedade IsSorted de sua saída para True e as propriedades SortKeyPosition de suas colunas de saída.
No entanto, se você não usar uma transformação Classificação para classificar os dados, defina essas propriedades de classificação manualmente na transformação de origem ou upstream. Para definir as propriedades de classificação manualmente na transformação de origem ou upstream, siga o próximo procedimento.
Para definir manualmente atributos de classificação em um componente de origem ou transformação
No Business Intelligence Development Studio, abra o projeto Integration Services que contém o pacote desejado.
No Gerenciador de Soluções, clique duas vezes no pacote para abri-lo.
Na guia Fluxo de Dados, localize a transformação apropriada de origem ou upstream ou arraste-a da Caixa de Ferramentas para a superfície de design.
Clique com o botão direito do mouse no componente e clique em Mostrar Editor Avançado.
Clique na guia Propriedades de Entrada e Saída.
Clique em Saída do <nome do componente> e defina a propriedade IsSorted como True.
Observação Se você definir manualmente a propriedade IsSorted da saída como True e os dados não forem classificados, ausências de dados ou comparações de dados inválidas poderão ocorrer na transformação Mesclar ou Junção de Mesclagem de downstream durante a execução do pacote.
Expanda Colunas de Saída.
Clique na coluna que você deseja indicar que está classificada e defina sua propriedade SortKeyPosition como um valor de inteiro diferente de zero de acordo com estas diretrizes:
O valor do número inteiro deve representar uma sequência numérica, começando com 1 e incrementado em 1.
Um valor inteiro positivo indica uma ordem de classificação crescente.
Um valor inteiro negativo indica uma ordem de classificação decrescente. (Se definido com um número negativo, o valor absoluto do número determinará a posição da coluna na sequência de classificação.)
O valor padrão de 0 indica que a coluna não está classificada. Deixe o valor de 0 para colunas de saída que não participam da classificação.
Como exemplo de como definir a propriedade SortKeyPosition, considere a seguinte instrução Transact-SQL que carrega os dados em uma origem:
SELECT * FROM MyTable ORDER BY ColumnA, ColumnB DESC, ColumnC
Para esta instrução, você definirá a propriedade SortKeyPosition de cada coluna da seguinte forma:
Defina a propriedade SortKeyPosition da Coluna A como 1. Isso indica que a Coluna A é a primeira a ser classificada e é classificada em ordem crescente.
Defina a propriedade SortKeyPosition da Coluna B como -2. Isso indica que a Coluna B é a segunda a ser classificada e é classificada em ordem decrescente.
Defina a propriedade SortKeyPosition da Coluna C como 3. Isso indica que a Coluna C é a terceira a ser classificada e é classificada em ordem crescente.
Repita a etapa 8 para cada coluna classificada.
Clique em OK.
Para salvar o pacote atualizado, clique em Salvar Itens Selecionados no menu Arquivo.
Consulte também