Partager via


Leçon 1 : Créer un projet et un package de base avec SQL Server Integration Services (SSIS)

S’applique à : SQL Server SSIS Integration Runtime dans Azure Data Factory

Dans cette leçon, vous allez créer un package extraction, transformation et chargement (ETL) simple. Au cours de cette leçon, vous créez un package ETL simple qui extrait des données d’une seule source de fichier plat, transforme ces données en utilisant deux transformations de recherche et écrit les données transformées dans une copie de la table de faits FactCurrencyRate de l’exemple de base de données AdventureWorksDW2022. Dans le cadre de cette leçon, vous apprenez à créer des packages, ajouter et configurer des sources de données et des destinations et enfin, à utiliser le nouveau flux de contrôle et les composants de flux de données.

Avant de créer un package, vous devez comprendre le formatage utilisé pour les données sources et la destination. Vous êtes ensuite prêt à définir les transformations nécessaires pour mapper les données source avec les données de destination.

Prérequis

Ce tutoriel s’appuie sur Microsoft SQL Server Data Tools, ensemble d’exemples de package, et sur un exemple de base de données.

Examiner la source de données

Dans le cadre de ce tutoriel, les données sources sont représentées par un ensemble de données monétaires d’historique dans un fichier plat nommé SampleCurrencyData.txt. Les données sources contiennent les quatre colonnes suivantes : le taux moyen de la devise, une clé de devise, une clé de date et le taux de clôture.

Voici un exemple des données sources du fichier SampleCurrencyData.txt :

1.00070049USD9/3/05 0:001.001201442
1.00020004USD9/4/05 0:001
1.00020004USD9/5/05 0:001.001201442
1.00020004USD9/6/05 0:001
1.00020004USD9/7/05 0:001.00070049
1.00070049USD9/8/05 0:000.99980004
1.00070049USD9/9/05 0:001.001502253
1.00070049USD9/10/05 0:000.99990001
1.00020004USD9/11/05 0:001.001101211
1.00020004USD9/12/05 0:000.99970009

Pour bien utiliser des données sources issues d’un fichier plat, il est important de comprendre comment le gestionnaire de connexions de fichiers plats interprète les données du fichier plat. Si la source du fichier plat est au format Unicode, le gestionnaire de connexions de fichiers plats définit toutes les colonnes avec le type [DT_WSTR] et une largeur par défaut égale à 50. Si la source du fichier plat est au format ANSI, les colonnes sont définies avec le type [DT_STR] et une largeur par défaut égale à 50. Il est probable que vous deviez changer ces valeurs par défaut pour affecter aux colonnes des types String qui s’appliquent davantage à vos données. Vous devez examiner le type de données de la destination, puis choisir ce type dans le gestionnaire de connexions de fichiers plats.

Examiner les données de destination

La destination des données sources est la copie de la table de faits FactCurrencyRate dans AdventureWorksDW2022. La table de faits FactCurrencyRate contient quatre colonnes et des relations avec deux tables de dimension, comme illustré ci-après.

Nom de la colonne Type de données Table de recherche colonne de recherche
AverageRate float None None
CurrencyKey int (FK) DimCurrency CurrencyKey (PK)
DateKey int (FK) DimDate DateKey (PK)
EndOfDayRate float None None

Mapper les données sources à la destination

Notre analyse du format des données sources et de destination indique que des recherches sont nécessaires pour les valeurs CurrencyKey et DateKey. Les transformations qui effectuent ces recherches obtiennent ces valeurs en utilisant les autres clés des tables de dimension DimCurrency et DimDate.

Colonne de fichier plat Nom de la table Nom de la colonne Type de données
0 FactCurrencyRate AverageRate float
1 DimCurrency CurrencyAlternateKey nchar(3)
2 DimDate FullDateAlternateKey date
3 FactCurrencyRate EndOfDayRate float

Tâches de la leçon

Cette leçon contient les tâches suivantes :

Démarrer la leçon

Étape 1 : Créer un projet Integration Services