Extraire, transformer et charger des données sur Linux avec SSIS

S’applique à :SQL Server - Linux

Cet article explique comment exécuter des packages SQL Server Integration Services (SSIS) sur Linux. SSIS résout des problèmes complexes d'intégration de données en extrayant des données de plusieurs sources et formats, en transformant et en nettoyant les données, puis en les chargeant vers différentes destinations.

Les packages SSIS fonctionnant sur Linux peuvent se connecter à Microsoft SQL Server sur Windows en local ou dans le cloud, sur Linux ou dans Docker. Ils peuvent également se connecter à Azure SQL Database, à Azure Synapse Analytics, à des sources de données ODBC, à des fichiers plats et à d'autres sources de données, notamment des sources ADO.NET, des fichiers XML et des services OData.

Pour plus d’informations sur les capacités de SSIS, consultez SQL Server Integration Services.

Prérequis

Pour exécuter des packages SSIS sur un ordinateur Linux, vous devez d'abord installer SQL Server Integration Services. SSIS n'est pas inclus dans l'installation de SQL Server pour les ordinateurs Linux. Pour les instructions d'installation, consultez Installer SQL Server Integration Services (SSIS) sur Linux.

Vous devez également disposer d'un ordinateur Windows pour créer et gérer les packages. Les outils de conception et de gestion SSIS sont des applications Windows actuellement non disponibles pour les ordinateurs Linux.

Exécuter un package SSIS

Pour exécuter un paquet SSIS sur un ordinateur Linux, procédez comme suit :

  1. Copiez le package SSIS sur l'ordinateur Linux.

  2. Exécutez la commande suivante :

    dtexec /F \<package name \> /DE <protection password>
    

Exécutez un package chiffré (protégé par un mot de passe)

Il existe trois façons d'exécuter un package SSIS chiffré avec un mot de passe :

  1. Définir la valeur de la variable d'environnement SSIS_PACKAGE_DECRYPT, comme indiqué dans l'exemple suivant :

    SSIS_PACKAGE_DECRYPT=test /opt/ssis/bin/dtexec /f package.dtsx
    
  2. Spécifier l'option /de[crypt] pour entrer le mot de passe de manière interactive, comme indiqué dans l'exemple suivant :

    /opt/ssis/bin/dtexec /f package.dtsx /de
    
    Enter decryption password:
    
  3. Spécifier l'option /de pour fournir le mot de passe dans la ligne de commande, comme indiqué dans l'exemple suivant. Cette méthode n'est pas recommandée car elle stocke le mot de passe de déchiffrement avec la commande dans l'historique des commandes.

    opt/ssis/bin/dtexec /f package.dtsx /de test
    
    Warning: Using /De[crypt] <password> may store decryption password in command history.
    
    You can use /De[crypt] instead to enter interactive mode,
    or use environment variable SSIS_PACKAGE_DECRYPT to set decryption password.
    

Concevoir des packages

Se connecter à des sources de données ODBC. Avec SSIS sur Linux CTP 2.1 Refresh et versions ultérieures, les packages SSIS peuvent utiliser les connexions ODBC sur Linux. Cette fonctionnalité a été testée avec les pilotes SQL Server et MySQL ODBC, mais elle devrait également fonctionner avec tout pilote ODBC Unicode conforme au standard ODBC. Au moment de la conception, vous pouvez fournir un DSN ou une chaîne de connexion pour vous connecter aux données ODBC ; vous pouvez également utiliser l'authentification Windows. Pour plus d'informations, consultez le billet de blog annonçant le support d’ODBC sur Linux.

Chemins d'accès. Fournissez des chemins de style Windows dans vos packages SSIS. SSIS sur Linux ne prend pas en charge les chemins de style Linux, mais mappe les chemins de style Windows aux chemins de style Linux lors de l'exécution. Ensuite, par exemple, SSIS sur Linux mappe le chemin de style Windows C:\test au chemin de style Linux /test.

Déployer des packages

Vous ne pouvez stocker des packages dans le système de fichiers sur Linux que dans cette version. La base de données du catalogue SSIS et le service SSIS hérité ne sont pas disponibles sur Linux pour le déploiement et le stockage des packages.

Planifier les packages

Vous pouvez utiliser les outils de planification du système Linux tels que cron pour planifier les packages. Vous ne pouvez pas utiliser SQL Agent sur Linux pour planifier l'exécution des packages dans cette version. Pour plus d'informations, consultez Planifier l'exécution des packages SQL Server Integration Services sur Linux avec cron.

Limitations et problèmes connus

Pour des informations détaillées sur les limitations et les problèmes connus de SSIS sur Linux, voir Limitations et problèmes connus pour SSIS sur Linux.

En savoir plus sur SSIS sur Linux

Pour plus d’informations concernant SSIS sur Linux, consultez les billets de blog suivants :

En savoir plus sur SSIS

Microsoft SQL Server Integration Services (SSIS) est une plateforme conçue pour créer des solutions d’intégration de données à hautes performances, notamment des packages d’extraction, de transformation et de chargement (ETL) pour l’entreposage de données. Pour plus d’informations, consultez SQL Server Integration Services.

SSIS inclut les fonctionnalités suivantes :

  • Des outils graphiques et des assistants pour construire et déboguer des packages sur Windows
  • Une variété de tâches pour exécuter des fonctions de workflow telles que les opérations FTP, l'exécution d'instructions SQL et l'envoi d’e-mails
  • Diverses sources de données et de destinations pour l'extraction et le chargement des données
  • Une variété de transformations pour le nettoyage, l'agrégation, la fusion et la copie des données
  • Des interfaces de programmation d'applications (API) pour étendre le SSIS avec vos propres scripts et composants personnalisés

Pour bien démarrer avec SSIS, téléchargez la dernière version de SSIS Comment créer un Package ETL.

Pour en savoir plus sur SSIS, consultez les articles suivants :