Share via


Lição 1: Criar um projeto e pacote básico com oSQL Server Integration Services (SSIS)

Aplica-se a:SQL Server SSIS Integration Runtime no Azure Data Factory

Nessa lição, você criará um pacote simples de extração, transformação e carregamento (ETL). O pacote extrai dados de uma fonte única de arquivo simples, transforma os dados usando duas transformações de pesquisa e grava os dados transformados em uma cópia da tabela de fatos FactCurrencyRate no banco de dados de exemplo AdventureWorksDW2022. Como parte dessa lição, você aprende a criar novos pacotes, adicionar e configurar conexões de destino e de fonte de dados e trabalhar com novos fluxos de controle e componentes de fluxo.

Antes de criar um pacote, você precisa ter um bom conhecimento da formatação usada nos dados de origem e de destino. Em seguida, você estará pronto para definir as transformações necessárias para mapear os dados de origem para o destino.

Pré-requisitos

Este tutorial se baseia no Microsoft SQL Server Data Tools, um conjunto de pacotes de exemplo e um banco de dados de exemplo.

Examinar os dados de origem

Nesse tutorial, os dados de origem são um conjunto de dados de moeda corrente históricos em arquivo simples chamado SampleCurrencyData.txt. A fonte de dados tem as seguintes quatro colunas: a taxa média de moeda, uma chave de moeda, uma chave de data e a taxa de final do dia.

Aqui está um exemplo dos dados de origem no arquivo SampleCurrencyData.txt:

1.00070049USD9/3/05 0:001.001201442  
1.00020004USD9/4/05 0:001  
1.00020004USD9/5/05 0:001.001201442  
1.00020004USD9/6/05 0:001  
1.00020004USD9/7/05 0:001.00070049  
1.00070049USD9/8/05 0:000.99980004  
1.00070049USD9/9/05 0:001.001502253  
1.00070049USD9/10/05 0:000.99990001  
1.00020004USD9/11/05 0:001.001101211  
1.00020004USD9/12/05 0:000.99970009

Quando estiver trabalhando com os dados de origem de arquivo simples, é importante entender como o gerenciador de conexões de Arquivo Simples interpreta os dados de arquivo simples. Se a fonte do arquivo simples for Unicode, o gerenciador de conexões de Arquivo Simples definirá todas as colunas como [DT_WSTR] com uma largura padrão de coluna de 50. Se a fonte de arquivo simples for codificada por ANSI, as colunas estarão definidas como [DT_STR] com uma largura de coluna padrão de 50. Você provavelmente precisará alterar esses padrões para tornar os tipos de coluna de cadeia de caracteres mais aplicáveis para seus dados. Você precisará examinar o tipo de dados de destino e, em seguida, escolher o tipo dentro do Gerenciador de conexão de Arquivo Simples.

Examinar os dados de destino

O destino dos dados de origem é uma cópia da tabela de fatos FactCurrencyRate no AdventureWorksDW2022. A tabela de fatos FactCurrencyRate tem quatro colunas e tem relações com duas tabelas dimensionais, como mostrado na tabela a seguir.

Nome da coluna Tipo de Dados Tabela de pesquisa coluna de pesquisa
AverageRate float Nenhum Nenhum
CurrencyKey int (FK) DimCurrency CurrencyKey (PK)
DateKey int (FK) DimDate DateKey (PK)
EndOfDayRate float Nenhum Nenhum

Mapear os dados de origem para o destino

Nossa análise dos formatos de dados de origem e destino indicam que as pesquisas são necessárias para os valores CurrencyKey e DateKey. As transformações que executam essas pesquisas obtêm esses valores usando as chaves alternativas das tabelas de dimensões DimCurrency e DimDate.

Coluna de arquivo simples Nome da tabela Nome da coluna Tipo de Dados
0 FactCurrencyRate AverageRate float
1 DimCurrency CurrencyAlternateKey nchar(3)
2 DimDate FullDateAlternateKey date
3 FactCurrencyRate EndOfDayRate float

Tarefas da lição

Esta lição contém as seguintes tarefas:

Iniciar a lição

Etapa 1: Criar um projeto do Integration Services