Partage via


Copier des données de Vertica à l’aide d’Azure Data Factory ou de Synapse Analytics

S’APPLIQUE À : Azure Data Factory Azure Synapse Analytics

Conseil

Essayez Data Factory dans Microsoft Fabric, une solution d’analyse tout-en-un pour les entreprises. Microsoft Fabric couvre tous les aspects, du déplacement des données à la science des données, en passant par l’analyse en temps réel, l’aide à la décision et la création de rapports. Découvrez comment démarrer un nouvel essai gratuitement !

Cet article explique comment utiliser l’activité de copie dans Azure Data Factory ou Synapse Analytics pour copier des données de Vertica. Il s’appuie sur l’article Vue d’ensemble de l’activité de copie.

Fonctionnalités prises en charge

Ce connecteur Vertica est pris en charge pour les activités suivantes :

Fonctionnalités prises en charge IR
Activité de copie (source/-) ① (uniquement pour la version 1.0) ②
Activité de recherche ① (uniquement pour la version 1.0) ②

① Runtime d’intégration Azure ② Runtime d’intégration auto-hébergé

Pour obtenir la liste des banques de données prises en charge en tant que sources ou récepteurs par l’activité de copie, consultez le tableau Banques de données prises en charge.

Le service fournit un pilote intégré qui permet la connexion. Vous n’avez donc pas besoin d’installer manuellement un pilote à l’aide de ce connecteur.

Pour la version 2.0 (préversion), vous devez installer un pilote Vertica ODBC manuellement. Pour la version 1.0, le service fournit un pilote intégré qui permet la connexion. Vous n’avez donc pas besoin d’installer manuellement un pilote à l’aide de ce connecteur.

Prérequis

Si votre magasin de données se trouve dans un réseau local, un réseau virtuel Azure ou un cloud privé virtuel Amazon, vous devez configurer un runtime d’intégration auto-hébergé pour vous y connecter. Si vous utilisez la version 2.0 (préversion), votre version du runtime d’intégration auto-hébergé doit être 5.44.8984.1 ou ultérieure.

Pour plus d’informations sur les mécanismes de sécurité réseau et les options pris en charge par Data Factory, consultez Stratégies d’accès aux données.

Pour la version 1.0

Si votre magasin de données est un service de données cloud managé, vous pouvez utiliser Azure Integration Runtime. Si l’accès est limité aux adresses IP qui sont approuvées dans les règles de pare-feu, vous pouvez ajouter les adresses IP Azure Integration Runtime dans la liste d’autorisation.

Vous pouvez également utiliser la fonctionnalité de runtime d’intégration de réseau virtuel managé dans Azure Data Factory pour accéder au réseau local sans installer et configurer un runtime d’intégration auto-hébergé.

Installer le pilote ODBC Vertica pour la version 2.0 (préversion)

Pour utiliser le connecteur Vertica avec la version 2.0 (préversion), installez le pilote ODBC Vertica sur l’ordinateur exécutant le runtime d’intégration auto-hébergé en procédant comme suit :

  1. Télécharger la configuration du client Vertica pour le pilote ODBC à partir de  pilotes clients | OpenText™ Vertica™. Prenons l’exemple de configuration du système Windows :

    Capture d’écran d’un exemple de configuration du système Windows.

  2. Ouvrez le .exe téléchargé pour commencer le processus d’installation. 

    Capture d’écran du processus d’installation.

  3. Sélectionnez pilote ODBC sous Liste des composants Vertica, puis sélectionnez Suivant pour démarrer l’installation.

    Capture d’écran de sélection de pilotes ODBC.

  4. Une fois le processus d’installation terminé, vous pouvez accéder à Démarrer –> Administrateur(-trice) de source de données ODBC pour confirmer la réussite de l’installation.

    Capture d’écran de la confirmation de la réussite de l’installation.

Mise en route

Vous pouvez créer un pipeline avec l’activité de copie à l’aide du SDK .NET, du SDK Python, d’Azure PowerShell, de l’API REST ou du modèle Azure Resource Manager. Pour obtenir des instructions détaillées sur la création d’un pipeline avec une activité de copie, consultez le didacticiel sur l’activité de copie.

Créer un service lié à Vertica à l’aide de l’interface utilisateur

Utilisez les étapes suivantes pour créer un service lié à Vertica dans l’interface utilisateur du portail Azure.

  1. Accédez à l’onglet Gérer dans votre espace de travail Azure Data Factory ou Synapse et sélectionnez Services liés, puis cliquez sur Nouveau :

  2. Recherchez Vertica et sélectionnez le connecteur Vertica.

    Capture d’écran du connecteur Vertica.

  3. Configurez les informations du service, testez la connexion et créez le nouveau service lié.

    Capture d’écran de la configuration du service lié pour Vertica.

Informations de configuration du connecteur

Les sections suivantes fournissent des informations sur les propriétés utilisées pour définir les entités Data Factory spécifiques du connecteur Vertica.

Propriétés du service lié

Si vous utilisez la version 2.0 (préversion), les propriétés prises en charge pour le service lié Vertica sont les suivantes :

Propriété Description Obligatoire
type La propriété de type doit être définie sur Vertica Oui
server Le nom ou l’adresse IP du serveur auquel vous souhaitez vous connecter. Oui
port Le numéro de port de l’auditeur du serveur. Non, la valeur par défaut est 5433
database Nom de la base de données Vertica. Oui
uid L’identifiant de l’utilisateur(-trice) utilisé pour se connecter à la base de données. Oui
pwd Mot de passe que l’application utilise pour se connecter à la base de données. Oui
version Version lorsque vous sélectionnez la version 2.0 (préversion). La valeur est 2.0. Oui
connectVia Runtime d’intégration à utiliser pour la connexion à la banque de données. Pour plus d’informations, consultez la section Conditions préalables. Vous ne pouvez utiliser que le runtime d’intégration auto-hébergé et sa version doit être 5.44.8984.1 ou supérieure. Non

Exemple :

{
    "name": "VerticaLinkedService",
    "properties": {
        "type": "Vertica",
        "version": "2.0",
        "typeProperties": {
            "server": "<server>",
            "port": 5433,
            "uid": "<username>",
            "database": "<database>",
            "pwd": {
                "type": "SecureString",
                "value": "<password>"
             }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Exemple : stockage du mot de passe dans Azure Key Vault

{
    "name": "VerticaLinkedService",
    "properties": {
        "type": "Vertica",
        "version": "2.0",
        "typeProperties": {
            "server": "<server>",
            "port": 5433,
            "uid": "<username>",
            "database": "<database>",
            "pwd": { 
                "type": "AzureKeyVaultSecret", 
                "store": { 
                    "referenceName": "<Azure Key Vault linked service name>", 
                    "type": "LinkedServiceReference" 
                }, 
                "secretName": "<secretName>" 
            }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Si vous utilisez la version 1.0, les propriétés suivantes sont prises en charge :

Propriété Description Obligatoire
type La propriété de type doit être définie sur Vertica Oui
connectionString Chaîne de connexion ODBC permettant de se connecter à Vertica.
Vous pouvez également définir un mot de passe dans Azure Key Vault et extraire la configuration pwd de la chaîne de connexion. Pour plus d’informations, reportez-vous aux exemples suivants et à l’article Stocker des informations d’identification dans Azure Key Vault.
Oui
connectVia Runtime d’intégration à utiliser pour la connexion à la banque de données. Pour plus d’informations, consultez la section Conditions préalables. À défaut de spécification, le runtime d’intégration Azure par défaut est utilisé. Non

Exemple :

{
    "name": "VerticaLinkedService",
    "properties": {
        "type": "Vertica",
        "typeProperties": {
            "connectionString": "Server=<server>;Port=<port>;Database=<database>;UID=<user name>;PWD=<password>"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Propriétés du jeu de données

Pour obtenir la liste complète des sections et propriétés disponibles pour la définition de jeux de données, consultez l’article sur les jeux de données. Cette section contient la liste des propriétés prises en charge par le jeu de données Vertica.

Pour copier des données de Vertica, affectez la valeur VerticaTable à la propriété type du jeu de données. Les propriétés prises en charge sont les suivantes :

Propriété Description Obligatoire
type La propriété type du jeu de données doit être définie sur : VerticaTable Oui
schéma Nom du schéma. Non (si « query » dans la source de l’activité est spécifié)
table Nom de la table. Non (si « query » dans la source de l’activité est spécifié)

Exemple

{
    "name": "VerticaDataset",
    "properties": {
        "type": "VerticaTable",
        "typeProperties": {},
        "schema": [],
        "linkedServiceName": {
            "referenceName": "<Vertica linked service name>",
            "type": "LinkedServiceReference"
        }
    }
}

Propriétés de l’activité de copie

Pour obtenir la liste complète des sections et des propriétés disponibles pour la définition des activités, consultez l’article Pipelines. Cette section contient la liste des propriétés prises en charge par la source Vertica.

Vertica en tant que source

Pour copier des données de Vertica, définissez VerticaSource comme type de source dans l’activité de copie. Les propriétés prises en charge dans la section source de l’activité de copie sont les suivantes :

Propriété Description Obligatoire
type La propriété type de la source d’activité de copie doit être définie sur VerticaSource Oui
query Utiliser la requête SQL personnalisée pour lire les données. Par exemple : "SELECT * FROM MyTable". Non (si « schéma+table » est spécifié dans le jeu de données)

Exemple :

"activities":[
    {
        "name": "CopyFromVertica",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<Vertica input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "VerticaSource",
                "query": "SELECT * FROM MyTable"
            },
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

Propriétés de l’activité Lookup

Pour en savoir plus sur les propriétés, consultez Activité Lookup.

Mettre à niveau la version Vertica

Voici les étapes qui vous aideront à mettre à niveau votre version de Vertica :

  1. Installez un pilote ODBC Vertica en suivant les étapes décrites dans Prérequis.
  2. Sur la page Modifier le service lié, sélectionnez 2.0 (préversion) sous Version et configurez le service lié en vous référant aux Propriétés du service lié.
  3. Appliquer un runtime d’intégration auto-hébergé avec la version 5.44.8984.1 ou supérieure. Azure Integration Runtime n’est pas prise en charge par la version 2.0 (préversion).

Pour obtenir une liste des magasins de données pris en charge comme sources et récepteurs par l’activité de copie, consultez la section sur les magasins de données pris en charge.