Copier des données à partir de PostgreSQL V2 à l’aide de Azure Data Factory ou Synapse Analytics

S'APPLIQUE À : Azure Data Factory Azure Synapse Analytics

Conseil

Data Factory dans Microsoft Fabric est la prochaine génération de Azure Data Factory, avec une architecture plus simple, une IA intégrée et de nouvelles fonctionnalités. Si vous débutez avec l'intégration des données, commencez par Fabric Data Factory. Les charges de travail ADF existantes peuvent être mises à niveau vers Fabric pour accéder à de nouvelles fonctionnalités dans la science des données, l’analytique en temps réel et la création de rapports.

Cet article explique comment utiliser l’activité de copie dans les pipelines Azure Data Factory et Synapse Analytics pour copier des données à partir d’une base de données PostgreSQL. Il s’appuie sur l’article Vue d’ensemble de l’activité de copie.

Important

Le connecteur PostgreSQL V1 est à l’étape de suppression. Vous êtes recommandé de mettre à niveau le connecteur PostgreSQL de V1 vers V2.

Fonctionnalités prises en charge

Ce connecteur PostgreSQL est pris en charge pour les fonctionnalités suivantes :

Fonctionnalités prises en charge	IR
activité Copy (source/-)	(1) (2)
Activité de recherche	(1) (2)

(1) Moteur d'intégration Azure (2) Moteur d'intégration auto-hébergé

Pour obtenir la liste des banques de données prises en charge en tant que sources ou récepteurs par l’activité de copie, consultez le tableau Banques de données prises en charge.

Plus spécifiquement, ce connecteur PostgreSQL prend en charge PostgreSQL version 12 et ultérieures.

Prérequis

Si votre magasin de données se trouve à l’intérieur d’un réseau local, d’un réseau virtuel Azure ou d’Amazon Virtual Private Cloud, vous devez configurer un runtime d’intégration auto-hébergé /c0<> pour vous y connecter.

Si votre magasin de données est un service de données cloud managé, vous pouvez utiliser le Azure Integration Runtime. Si l’accès est limité aux adresses IP approuvées dans les règles de pare-feu, vous pouvez ajouter adresses IP d'Azure Integration Runtime à la liste autorisée.

Vous pouvez également utiliser la fonctionnalité runtime d’intégration de réseau virtuel managé dans Azure Data Factory pour accéder au réseau local sans installer et configurer un runtime d’intégration auto-hébergé.

Pour plus d’informations sur les mécanismes de sécurité réseau et les options pris en charge par Data Factory, consultez Stratégies d’accès aux données.

Le Integration Runtime fournit un pilote PostgreSQL intégré à partir de la version 3.7. Par conséquent, vous n'avez pas besoin d'installer manuellement un pilote.

Prise en main

Pour effectuer l’activité de copie avec un pipeline, vous pouvez utiliser l’un des outils ou kits sdk suivants :

Créer un service lié à PostgreSQL à l’aide de l’interface utilisateur

Procédez comme suit pour créer un service lié à PostgreSQL dans l’interface utilisateur du portail Azure.

Accédez à l’onglet Gérer dans votre espace de travail Azure Data Factory ou Synapse, puis sélectionnez Services liés, puis cliquez sur Nouveau :
- Azure Data Factory
- Azure Synapse
Recherchez Postgre et sélectionnez le connecteur PostgreSQL.
Configurez les informations du service, testez la connexion et créez le nouveau service lié.

Détails de configuration du connecteur

Les sections suivantes fournissent des informations sur les propriétés utilisées pour définir les entités Data Factory spécifiques du connecteur PostgreSQL.

Propriétés du service lié

Les propriétés prises en charge pour le service lié PostgreSQL sont les suivantes :

Propriété	Descriptif	Obligatoire
type	La propriété type doit avoir la valeur : PostgreSqlV2	Oui
serveur	Spécifie le nom d’hôte (et éventuellement le port) sur lequel PostgreSQL s’exécute.	Oui
port	Port TCP du serveur PostgreSQL.	Non
base de données	Base de données PostgreSQL à laquelle se connecter.	Oui
nom d'utilisateur	Nom d’utilisateur avec lequel se connecter.	Oui
mot de passe	Mot de passe avec lequel se connecter.	Oui
sslMode	Contrôle si SSL est utilisé, en fonction de la prise en charge du serveur. - Désactivé : SSL est désactivé. Si le serveur impose l’utilisation de SSL, la connexion échoue. - Allow : privilégie les connexions non SSL si le serveur les autorise, mais autorise les connexions SSL. - Préféré : préférez les connexions SSL si le serveur les autorise, mais autorisez les connexions sans SSL. - Obligatoire : échec de la connexion si le serveur ne prend pas en charge SSL. - Verify_ca : échec de la connexion si le serveur ne prend pas en charge SSL. Vérifie également le certificat de serveur. - Verify_full : échec de la connexion si le serveur ne prend pas en charge SSL. Vérifie également le certificat de serveur en le comparant au nom de l’hôte. Options : Désactivé (0) / Autoriser (1) / Préféré (2 ) (par défaut) / Obligatoire (3) / Verify_ca (4) / Verify_full (5)	Non
type d'authentification	Type d’authentification pour la connexion à la base de données. Prend en charge uniquement Basic.	Oui
connectVia	Le Integration Runtime à utiliser pour se connecter au stockage de données. Pour plus d’informations, consultez la section Conditions préalables. S’il n’est pas spécifié, il utilise la Azure Integration Runtime par défaut.	Non
Propriétés de connexion supplémentaires :
schéma	Définit le chemin d’accès de recherche du schéma.	Non
pooling	Indique si le regroupement de connexions doit être utilisé.	Non
connectionTimeout	Délai alloué (en secondes) pour tenter d’établir une connexion avant de mettre fin à la tentative, et de générer une erreur.	Non
commandTimeout	Délai alloué (en secondes) pour tenter d’exécuter une commande avant de mettre fin à la tentative, et de générer une erreur. L’affectation de la valeur zéro indique un temps infini.	Non
trustServerCertificate	Indique si le certificat de serveur doit être approuvé ou non sans être validé.	Non
sslCertificate	Emplacement d’un certificat client à envoyer au serveur.	Non
clé SSL	Emplacement d’une clé cliente pour l’envoi d’un certificat client au serveur.	Non
sslPassword	Mot de passe d’une clé de certificat client.	Non
readBufferSize	Détermine la taille de la mémoire tampon interne utilisée par Npgsql au moment de la lecture. L’augmentation de cette taille peut améliorer les performances pour le transfert de données volumineuses à partir de la base de données.	Non
logParameters	Quand cette option est activée, les valeurs de paramètre sont journalisées au moment de l’exécution des commandes.	Non
timezone	Obtient ou définit le fuseau horaire de la session.	Non
encodage	Obtient ou définit l’encodage .NET qui sera utilisé pour encoder/décoder les données de chaîne PostgreSQL.	Non

Remarque

Pour disposer d’une vérification SSL complète via la connexion ODBC lors de l’utilisation de l’Integration Runtime auto-hébergé, vous devez utiliser une connexion de type ODBC au lieu du connecteur PostgreSQL explicitement, puis effectuer la configuration suivante :

Configurez le DSN sur tous les serveurs SHIR.
Placez le certificat approprié pour PostgreSQL dans C :\Windows\ServiceProfiles\DIAHostService\AppData\Roaming\postgresql\root.crt sur les serveurs SHIR. C’est là que le pilote ODBC recherche > le certificat SSL à vérifier lorsqu’il se connecte à la base de données.
Dans votre connexion d'usine de données, utilisez une connexion de type ODBC, avec votre "chaîne de connexion" pointant vers le DSN que vous avez créé sur vos serveurs SHIR.

Exemple :

{
    "name": "PostgreSqlLinkedService",
    "properties": {
        "type": "PostgreSqlV2",
        "typeProperties": {
            "server": "<server>",
            "port": 5432,
            "database": "<database>",
            "username": "<username>",
            "password": {
                "type": "SecureString",
                "value": "<password>"
            },
            "sslmode": <sslmode>,
            "authenticationType": "Basic"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Example : stocker le mot de passe dans Azure Key Vault

{
    "name": "PostgreSqlLinkedService",
    "properties": {
        "type": "PostgreSqlV2",
        "typeProperties": {
            "server": "<server>",
            "port": 5432,
            "database": "<database>",
            "username": "<username>",
            "password": {
                "type": "AzureKeyVaultSecret",
                "store": { 
                    "referenceName": "<Azure Key Vault linked service name>",
                    "type": "LinkedServiceReference"
                },
                "secretName": "<secretName>"
            }
            "sslmode": <sslmode>,
            "authenticationType": "Basic"
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Propriétés du jeu de données

Pour obtenir la liste complète des sections et propriétés disponibles pour la définition de jeux de données, consultez l’article sur les jeux de données. Cette section fournit la liste des propriétés prises en charge par le jeu de données PostgreSQL.

Pour copier des données à partir de PostgreSQL, les propriétés prises en charge sont les suivantes :

Propriété	Descriptif	Obligatoire
type	La propriété type du jeu de données doit avoir la valeur : PostgreSqlV2Table	Oui
schéma	Nom du schéma.	Non (si « query » dans la source de l’activité est spécifié)
table	Nom de la table.	Non (si « query » dans la source de l’activité est spécifié)

Exemple

{
    "name": "PostgreSQLDataset",
    "properties":
    {
        "type": "PostgreSqlV2Table",
        "linkedServiceName": {
            "referenceName": "<PostgreSQL linked service name>",
            "type": "LinkedServiceReference"
        },
        "annotations": [],
        "schema": [],
        "typeProperties": {
            "schema": "<schema name>",
            "table": "<table name>"
        }
    }
}

Si vous utilisiez un dataset typé RelationalTable, il reste pris en charge tel quel, mais nous vous suggérons d’utiliser désormais le nouveau dataset.

Propriétés de l'activité de copie

Pour obtenir la liste complète des sections et des propriétés disponibles pour la définition des activités, consultez l’article Pipelines. Cette section fournit la liste des propriétés prises en charge par la source PostgreSQL.

PostgreSQL en tant que source

Pour copier des données à partir de PostgreSQL, les propriétés prises en charge dans la section source de l’activité de copie sont les suivantes :

Propriété	Descriptif	Obligatoire
type	La propriété type de la source de l’activité Copy doit avoir la valeur : PostgreSqlV2Source	Oui
requête	Utiliser la requête SQL personnalisée pour lire les données. Par exemple : `"query": "SELECT * FROM \"MySchema\".\"MyTable\""`.	Non (si « tableName » est spécifié dans dataset)
queryTimeout	Le temps d’attente avant de mettre fin à la tentative d’exécution d’une commande et de générer une erreur ; la valeur par défaut est de 120 minutes. Si un paramètre est défini pour cette propriété, les valeurs autorisées sont un intervalle de temps, par exemple « 02:00:00 » (120 minutes). Pour plus d’informations, consultez CommandTimeout. Si `commandTimeout` et `queryTimeout` sont tous deux configurés, `queryTimeout` est prioritaire.	Non

Remarque

Les noms de schéma et de table respectent la casse. Encadrez-les avec des guillemets doubles ("") dans la requête.

Exemple :

"activities":[
    {
        "name": "CopyFromPostgreSQL",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<PostgreSQL input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "PostgreSqlV2Source",
                "query": "SELECT * FROM \"MySchema\".\"MyTable\"",
                "queryTimeout": "00:10:00"
            },
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

Si vous utilisiez une source de données typée RelationalSource, elle reste prise en charge telle quelle, mais nous vous suggérons d’utiliser désormais la nouvelle source.

Mappage de type de données pour PostgreSQL

Quand vous copiez des données à partir de PostgreSQL, les mappages suivants sont utilisés entre les types de données PostgreSQL et les types de données temporaires utilisés par le service de manière interne. Pour découvrir comment l’activité de copie mappe le schéma et le type de données la source au récepteur, voir Mappages de schémas et de types de données.

Type de données PostgreSQL	Type de données de service intermédiaire pour PostgreSQL V2	Type de données de service intermédiaire pour PostgreSQL V1
`SmallInt`	`Int16`	`Int16`
`Integer`	`Int32`	`Int32`
`BigInt`	`Int64`	`Int64`
`Decimal` (Précision <= 28)	`Decimal`	`Decimal`
`Decimal` (Précision > 28)	Non pris en charge	`String`
`Numeric`	`Decimal`	`Decimal`
`Real`	`Single`	`Single`
`Double`	`Double`	`Double`
`SmallSerial`	`Int16`	`Int16`
`Serial`	`Int32`	`Int32`
`BigSerial`	`Int64`	`Int64`
`Money`	`Decimal`	`String`
`Char`	`String`	`String`
`Varchar`	`String`	`String`
`Text`	`String`	`String`
`Bytea`	`Byte[]`	`Byte[]`
`Timestamp`	`DateTime`	`DateTime`
`Timestamp with time zone`	`DateTime`	`String`
`Date`	`DateTime`	`DateTime`
`Time`	`TimeSpan`	`TimeSpan`
`Time with time zone`	`DateTimeOffset`	`String`
`Interval`	`TimeSpan`	`String`
`Boolean`	`Boolean`	`Boolean`
`Point`	`String`	`String`
`Line`	`String`	`String`
`Iseg`	`String`	`String`
`Box`	`String`	`String`
`Path`	`String`	`String`
`Polygon`	`String`	`String`
`Circle`	`String`	`String`
`Cidr`	`String`	`String`
`Inet`	`String`	`String`
`Macaddr`	`String`	`String`
`Macaddr8`	`String`	`String`
`Tsvector`	`String`	`String`
`Tsquery`	`String`	`String`
`UUID`	`Guid`	`Guid`
`Json`	`String`	`String`
`Jsonb`	`String`	`String`
`Array`	`String`	`String`
`Bit`	`Byte[]`	`Byte[]`
`Bit varying`	`Byte[]`	`Byte[]`
`XML`	`String`	`String`
`IntArray`	`String`	`String`
`TextArray`	`String`	`String`
`NumericArray`	`String`	`String`
`DateArray`	`String`	`String`
`Range`	`String`	`String`
`Bpchar`	`String`	`String`

Propriétés de l’activité Lookup

Pour en savoir plus sur les propriétés, consultez Activité Lookup.

Mettre à niveau le connecteur PostgreSQL

Voici des étapes qui vous aident à mettre à niveau votre connecteur PostgreSQL :

Créez un service lié PostgreSQL, et configurez-le en vous référant aux Propriétés du service lié.
Le mappage de type de données pour le connecteur PostgreSQL V2 est différent de celui pour V1. Pour en savoir plus sur le dernier mappage de type de données, consultez Mappage de type de données pour PostgreSQL.

Différences entre PostgreSQL V2 et V1

Le tableau ci-dessous présente les différences de mappage de type de données entre PostgreSQL V2 et V1.

Type de données PostgreSQL	Type de données de service intermédiaire pour PostgreSQL V2	Type de données de service intermédiaire pour PostgreSQL V1
Argent	Decimal	String
Timestamp avec fuseau horaire	DateTime	String
Heure avec fuseau horaire	DateTimeOffset	String
Intervalle	TimeSpan	String
BigDecimal	Non pris en charge. Vous pouvez également utiliser la fonction `to_char()` pour convertir BigDecimal en type String.	String

Consultez les banques de données prises en charge pour obtenir la liste des banques de données prises en charge en tant que sources et récepteurs par l’activité de copie.

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2026-04-07