Configurer HTTP dans une activité de copie
Cet article explique comment utiliser l’activité de copie dans un pipeline de données pour copier des données depuis et vers HTTP.
Format pris en charge
HTTP prend en charge les formats de fichier suivants. Reportez-vous à chaque article pour les paramètres basés sur le format.
- Format Avro
- Format binaire
- Format de texte délimité
- Format Excel
- Format JSON
- Format ORC
- Format Parquet
- Format XML
Configuration prise en charge
Pour la configuration de chaque onglet sous l’activité de copie, accédez respectivement aux sections suivantes.
Remarque
La destination n’est pas prise en charge dans le connecteur HTTP.
Général
Reportez-vous aux instructions relatives aux paramètres Général pour configurer l’onglet Paramètres Général .
Source
Les propriétés suivantes sont prises en charge pour HTTP sous l’onglet Source d’une activité de copie.
Les trois propriétés suivantes sont requises :
- Type de magasin de données : sélectionnez Externe.
- Connexion : sélectionnez une connexion HTTP dans la liste des connexions. Si aucune connexion n’existe, créez une connexion HTTP en sélectionnant Nouveau.
- Type de connexion : sélectionnez HTTP.
- URL relative : Une URL relative de la ressource qui contient les données. Quand cette propriété n’est pas spécifiée, seule l’URL indiquée dans la définition de connexion est utilisée. Le connecteur HTTP copie les données à partir de l’URL combinée :
/[relative URL specified]
. - Paramètres de fichier : sélectionnez Paramètres de fichier pour configurer le format de fichier. Pour connaître les paramètres des différents formats de fichier, reportez-vous aux articles de Format pris en charge pour plus d’informations.
Sous Avancé, vous pouvez spécifier les champs suivants :
Méthode de demande : méthode HTTP. Les valeurs autorisées sont Get (par défaut) et Post.
En-têtes supplémentaires : en-têtes de demande HTTP supplémentaires.
Corps de la demande : corps de la demande HTTP.
Délai d’expiration : Le délai (valeur TimeSpan) pour l’obtention d’une réponse par la demande HTTP. Cette valeur correspond au délai d’expiration pour l’obtention d’une réponse, et non au délai d’expiration pour la lecture des données de la réponse. La valeur par défaut est 00:01:40.
Nombre maximal de connexions simultanées : la limite supérieure de connexions simultanées établies au magasin de données pendant l’exécution de l’activité. Spécifiez une valeur uniquement lorsque vous souhaitez limiter les connexions simultanées.
Ignorer le nombre de lignes : Le nombre de lignes non vides à ignorer lors de la lecture des données à partir des fichiers d’entrée.
Colonnes supplémentaires: Ajoutez des colonnes de données supplémentaires pour stocker le chemin relatif ou la valeur statique des fichiers source. L'expression est prise en charge pour ce dernier.
Mappage
Pour la configuration de l’onglet Mappage, consultez Configurer vos mappages sous l’onglet Mappage. Si vous choisissez Binaire comme format de fichier, le mappage n’est pas pris en charge.
Paramètres
Pour la configuration de l’onglet Paramètres, accédez à Configurer vos autres paramètres sous l’onglet Paramètres.
Résumé du tableau
La table suivante contient plus d’informations sur l’activité de copie dans HTTP.
Source
Nom | Description | Valeur | Obligatoire | Propriété de script JSON |
---|---|---|---|---|
Type de banque de données | Votre type de magasin de données. | Externe | Oui | / |
Connection | Votre connexion au magasin de données source. | <votre connexion> | Oui | connection |
Type de connexion | La connexion de vos données source. | <connexion de votre source> | Oui | / |
URL relative | URL relative de la ressource qui contient les données. Quand cette propriété n’est pas spécifiée, seule l’URL indiquée dans la définition de connexion est utilisée. Le connecteur HTTP copie les données à partir de l’URL combinée : /[relative URL specified] . |
<votre URL relative de serveur> | Non | relativeUrl |
Méthode de demande | Méthode HTTP. Les valeurs autorisées sont Get (par défaut) et Post. | •GET •POST |
Non | requestMethod |
En-têtes supplémentaires | En-têtes de requête HTTP supplémentaires. | <vos en-têtes supplémentaires> | Non | additionalHeaders |
Corps de la demande | Le corps de la demande pour la demande HTTP. | <corps de la demande POST HTTP> | Non | requestBody |
Délai d’expiration de la demande | Délai d’expiration (la valeur TimeSpan) pour l’obtention d’une réponse par la demande HTTP. Cette valeur correspond au délai d’expiration pour l’obtention d’une réponse, et non au délai d’expiration pour la lecture des données de la réponse. La valeur par défaut est 00:01:40. | intervalle de temps | Non | requestTimeout |
Connexions simultanées maximales | La limite supérieure de connexions simultanées établies au magasin de données pendant l’exécution de l’activité. Spécifiez une valeur uniquement lorsque vous souhaitez limiter les connexions simultanées. | <connexions simultanées maximales> | Non | maxConcurrentConnections |
Nombre de lignes à ignorer | Le nombre de lignes non vides à ignorer lors de la lecture des données à partir des fichiers d’entrée. | <votre nombre de lignes à ignorer> | Non | skipLineCount |
Colonnes supplémentaires | Ajouter les colonnes de données supplémentaires pour stocker le chemin d’accès relatif ou la valeur statique des fichiers sources. L’expression est prise en charge pour ce dernier. | • Name • Valeur |
Non | additionalColumns : • nom • valeur |