Leçon 1 : Créer un projet et un package de base avec SQL Server Integration Services (SSIS)
S’applique à : SQL Server SSIS Integration Runtime dans Azure Data Factory
Dans cette leçon, vous allez créer un package extraction, transformation et chargement (ETL) simple. Au cours de cette leçon, vous créez un package ETL simple qui extrait des données d’une seule source de fichier plat, transforme ces données en utilisant deux transformations de recherche et écrit les données transformées dans une copie de la table de faits FactCurrencyRate de l’exemple de base de données AdventureWorksDW2022
. Dans le cadre de cette leçon, vous apprenez à créer des packages, ajouter et configurer des sources de données et des destinations et enfin, à utiliser le nouveau flux de contrôle et les composants de flux de données.
Avant de créer un package, vous devez comprendre le formatage utilisé pour les données sources et la destination. Vous êtes ensuite prêt à définir les transformations nécessaires pour mapper les données source avec les données de destination.
Prérequis
Ce tutoriel s’appuie sur Microsoft SQL Server Data Tools, ensemble d’exemples de package, et sur un exemple de base de données.
Pour installer SQL Server Data Tools, consultez Télécharger SQL Server Data Tools.
Pour télécharger tous les packages de leçons de ce tutoriel :
Accédez aux fichiers du tutoriel Integration Services.
Sélectionnez le bouton Télécharger.
Sélectionnez le fichier Creating a Simple ETL Package.zip, puis sélectionnez Suivant.
Une fois le fichier téléchargé, décompressez son contenu dans un répertoire local.
Pour installer et déployer l'exemple de base de données
AdventureWorksDW2022
, consultez Installer et configurer l'exemple de base de données AdventureWorks - SQL.
Examiner la source de données
Dans le cadre de ce tutoriel, les données sources sont représentées par un ensemble de données monétaires d’historique dans un fichier plat nommé SampleCurrencyData.txt. Les données sources contiennent les quatre colonnes suivantes : le taux moyen de la devise, une clé de devise, une clé de date et le taux de clôture.
Voici un exemple des données sources du fichier SampleCurrencyData.txt :
1.00070049USD9/3/05 0:001.001201442
1.00020004USD9/4/05 0:001
1.00020004USD9/5/05 0:001.001201442
1.00020004USD9/6/05 0:001
1.00020004USD9/7/05 0:001.00070049
1.00070049USD9/8/05 0:000.99980004
1.00070049USD9/9/05 0:001.001502253
1.00070049USD9/10/05 0:000.99990001
1.00020004USD9/11/05 0:001.001101211
1.00020004USD9/12/05 0:000.99970009
Pour bien utiliser des données sources issues d’un fichier plat, il est important de comprendre comment le gestionnaire de connexions de fichiers plats interprète les données du fichier plat. Si la source du fichier plat est au format Unicode, le gestionnaire de connexions de fichiers plats définit toutes les colonnes avec le type [DT_WSTR] et une largeur par défaut égale à 50. Si la source du fichier plat est au format ANSI, les colonnes sont définies avec le type [DT_STR] et une largeur par défaut égale à 50. Il est probable que vous deviez changer ces valeurs par défaut pour affecter aux colonnes des types String qui s’appliquent davantage à vos données. Vous devez examiner le type de données de la destination, puis choisir ce type dans le gestionnaire de connexions de fichiers plats.
Examiner les données de destination
La destination des données sources est la copie de la table de faits FactCurrencyRate dans AdventureWorksDW2022
. La table de faits FactCurrencyRate contient quatre colonnes et des relations avec deux tables de dimension, comme illustré ci-après.
Nom de la colonne | Type de données | Table de recherche | colonne de recherche |
---|---|---|---|
AverageRate |
float |
None | None |
CurrencyKey |
int (FK ) |
DimCurrency |
CurrencyKey (PK ) |
DateKey |
int (FK ) |
DimDate |
DateKey (PK ) |
EndOfDayRate |
float |
None | None |
Mapper les données sources à la destination
Notre analyse du format des données sources et de destination indique que des recherches sont nécessaires pour les valeurs CurrencyKey et DateKey. Les transformations qui effectuent ces recherches obtiennent ces valeurs en utilisant les autres clés des tables de dimension DimCurrency et DimDate.
Colonne de fichier plat | Nom de la table | Nom de la colonne | Type de données |
---|---|---|---|
0 | FactCurrencyRate |
AverageRate |
float |
1 | DimCurrency |
CurrencyAlternateKey |
nchar(3) |
2 | DimDate |
FullDateAlternateKey |
date |
3 | FactCurrencyRate |
EndOfDayRate |
float |
Tâches de la leçon
Cette leçon contient les tâches suivantes :
Étape 2 : Ajouter et configurer un gestionnaire de connexions de fichiers plats
Étape 3 : Ajouter et configurer un gestionnaire de connexions OLE DB
Étape 6 : Ajouter et configurer les transformations de recherche