Lección 1: Creación de un proyecto y un paquete básico con SQL Server Integration Services (SSIS)
Se aplica a: SQL Server SSIS Integration Runtime en Azure Data Factory
En esta lección, creará un paquete simple de extracción, transformación y carga (ETL). El paquete extrae datos extrae datos de un único origen de archivo plano, los transforma mediante dos componentes de transformación de búsqueda y escribe los datos transformados en una copia de la tabla de hechos FactCurrencyRate de la base de datos de muestra AdventureWorksDW2022
. Como parte de esta lección, aprenderá a crear paquetes, agregar y configurar orígenes de datos y conexiones de destino, y trabajar con nuevos componentes de flujo de control y flujo de datos.
Antes de crear un paquete, debe entender el formato que se usa en los datos de origen y de destino. Después, estará listo para definir las transformaciones necesarias para asignar los datos de origen al destino.
Requisitos previos
Este tutorial se basa en Microsoft SQL Server Data Tools, un conjunto de paquetes de ejemplo y una base de datos de ejemplo.
Para instalar SQL Server Data Tools, vea Descargar SQL Server Data Tools.
Para descargar todos los paquetes de la lección de este tutorial:
Vaya a los archivos de tutorial de Integration Services.
Haga clic en el botón DOWNLOAD (DESCARGAR).
Seleccione Creating a Simple ETL Package.zip (Creación de un sencillo archivo Package.zip de ETL) y, después, haga clic en Next (Siguiente).
Después de que se descargue el archivo, descomprima el contenido en un directorio local.
Para instalar e implementar la base de datos
AdventureWorksDW2022
de ejemplo, vea Configuración e instalación de una base de datos AdventureWorks de ejemplo - SQL.
Examen de los datos de origen
En este tutorial, los datos de origen son un conjunto de datos de moneda históricos que se encuentra en un archivo plano denominado SampleCurrencyData.txt. Los datos de origen tienen las cuatro columnas siguientes: tipo de cambio medio de la moneda, una clave de moneda, una clave de fecha y el tipo de cambio de final del día.
Este es un ejemplo de los datos de origen del archivo SampleCurrencyData.txt:
1.00070049USD9/3/05 0:001.001201442
1.00020004USD9/4/05 0:001
1.00020004USD9/5/05 0:001.001201442
1.00020004USD9/6/05 0:001
1.00020004USD9/7/05 0:001.00070049
1.00070049USD9/8/05 0:000.99980004
1.00070049USD9/9/05 0:001.001502253
1.00070049USD9/10/05 0:000.99990001
1.00020004USD9/11/05 0:001.001101211
1.00020004USD9/12/05 0:000.99970009
Cuando se trabaja con datos de origen de un archivo plano, es importante entender el modo en el que el administrador de conexiones de archivos planos interpreta los datos del archivo plano. Si el origen de archivo plano es Unicode, el administrador de conexiones de archivos planos define todas las columnas como [DT_WSTR], con un ancho de columna predeterminado de 50. Si el origen de archivo plano tiene la codificación ANSI, las columnas se definen como [DT_STR], con un ancho de columna predeterminado de 50. Es probable que tenga que cambiar estos valores predeterminados para que los tipos de columna de cadena sean más adecuados para los datos. Debe examinar el tipo de datos de destino y, después, elegir ese tipo en el Administrador de conexiones de archivos planos.
Examen de los datos de destino
El destino de los datos de origen es una copia de la tabla de hechos FactCurrencyRate de AdventureWorksDW2022
. La tabla de hechos FactCurrencyRate tiene cuatro columnas y tiene relaciones con dos tablas de dimensiones, como se muestra en la tabla siguiente.
Nombre de columna | Tipo de datos | Tabla de búsqueda | columna de búsqueda |
---|---|---|---|
AverageRate |
float |
None | None |
CurrencyKey |
int (FK ) |
DimCurrency |
CurrencyKey (PK ) |
DateKey |
int (FK ) |
DimDate |
DateKey (PK ) |
EndOfDayRate |
float |
None | None |
Asignación de los datos de origen al destino
El análisis de los formatos de datos de origen y de destino indica que se necesitan búsquedas para los valores CurrencyKey y DateKey. Las transformaciones que realizan estas búsquedas obtienen esos valores mediante las claves alternativas de las tablas de dimensiones DimCurrency y DimDate.
Columna de archivo plano | Nombre de la tabla | Nombre de columna | Tipo de datos |
---|---|---|---|
0 | FactCurrencyRate |
AverageRate |
float |
1 | DimCurrency |
CurrencyAlternateKey |
nchar(3) |
2 | DimDate |
FullDateAlternateKey |
date |
3 | FactCurrencyRate |
EndOfDayRate |
float |
Tareas de la lección
Esta lección contiene las siguientes tareas:
Paso 2: Incorporación y configuración de un administrador de conexiones de archivos planos
Paso 3: Adición y configuración de un administrador de conexiones OLE DB
Paso 6: Adición y configuración de las transformaciones de búsqueda