Obtenir des données d’Amazon S3

Article
02/06/2025

Dans cet article, vous allez apprendre à obtenir des données d’Amazon S3 dans une table nouvelle ou existante. Amazon S3 est un service de stockage d’objets conçu pour stocker et récupérer des données.

Pour plus d’informations sur Amazon S3, consultez Qu’est-ce qu’Amazon S3 ?.

Conditions préalables

Un espace de travail avec une capacité activée par Microsoft Fabric
Une base de données KQL avec des autorisations de modification
Un compartiment Amazon S3 avec des données

Source

Dans le ruban inférieur de votre base de données KQL, sélectionnez Obtenir des données.

Dans la fenêtre Obtenir des données, l’onglet source est sélectionné.
Sélectionnez la source de données dans la liste disponible. Dans cet exemple, vous ingérez des données à partir de Amazon S3.

Configurer

Sélectionnez une table cible. Si vous souhaitez ingérer des données dans une nouvelle table, sélectionnez +Nouvelle table et entrez un nom de table.

Remarque

Les noms de tables peuvent comporter jusqu’à 1 024 caractères, y compris des espaces, des caractères alphanumériques, des traits d’union et des traits de soulignement. Les caractères spéciaux ne sont pas pris en charge.
Dans le champ URI , collez la chaîne de connexion d’un compartiment unique ou d’un objet individuel dans le format suivant.

Compartiment : https://BucketName.s3.RegionName.amazonaws.com;AwsCredentials=AwsAccessID,AwsSecretKey

Si vous le souhaitez, vous pouvez appliquer des filtres de compartiments pour filtrer les données en fonction d’une extension de fichier spécifique.
Sélectionnez Suivant.

Inspecter

L’onglet Inspecter s’ouvre avec un aperçu des données.

Pour terminer le processus d’ingestion, sélectionnez Terminer.

capture d’écran

Optionnellement:

Sélectionnez Visionneuse de commandes pour afficher et copier les commandes automatiques générées à partir de vos entrées.
Utilisez le fichier de définition de schéma liste déroulante pour modifier le fichier à partir duquel le schéma est déduit.
Modifiez le format de données déduit automatiquement en sélectionnant le format souhaité dans la liste déroulante. Pour plus d’informations, consultez formats de données pris en charge par Real-Time Intelligence.
Modifier les colonnes.
Explorez les options avancées basées sur le type de données.

Modifier les colonnes

Remarque

Pour les formats tabulaires (CSV, TSV, PSV), vous ne pouvez pas mapper une colonne deux fois. Pour mapper à une colonne existante, commencez par supprimer la nouvelle colonne.
Vous ne pouvez pas modifier un type de colonne existant. Si vous essayez de mapper à une colonne avec un format différent, vous risquez de vous retrouver avec des colonnes vides.

Les modifications que vous pouvez apporter dans une table dépendent des paramètres suivants :

Si le type de la table est nouveau ou existant
Si le type du mappage est nouveau ou existant

Type de la table	Type de mappage	Ajustements disponibles
Nouvelle table	Nouveau mappage	Renommer une colonne, modifier le type de données, modifier la source de données, transformation de mappage, ajouter une colonne, supprimer une colonne
Table existante	Nouveau mappage	Ajouter une colonne (sur laquelle vous pouvez ensuite modifier le type de données, renommer et mettre à jour)
Table existante	Cartographie existante	aucun

Transformations de cartographie

Certains mappages de format de données (Parquet, JSON et Avro) prennent en charge des transformations simples au moment de l’ingestion. Pour appliquer des transformations de mappage, créez ou mettez à jour une colonne dans la fenêtre Modifier les colonnes.

Les transformations de mappage peuvent être effectuées sur une colonne de type chaîne ou datetime, avec la source ayant un type de données int ou long. Les transformations de mappage prises en charge sont les suivantes :

DateTimeFromUnixSeconds
DateTimeFromUnixMilliseconds
DateTimeFromUnixMicroseconds
DateTimeFromUnixNanoseconds

Options avancées basées sur le type de données

Tabulaire (CSV, TSV, PSV) :

Si vous ingérez des formats tabulaires dans une table existante, vous pouvez sélectionner Avancé>Conserver le schéma de table. Les données tabulaires n’incluent pas nécessairement les noms de colonnes utilisés pour mapper les données sources aux colonnes existantes. Lorsque cette option est cochée, le mappage est effectué par ordre et le schéma de table reste le même. Si cette option n’est pas cochée, de nouvelles colonnes sont créées pour les données entrantes, quelle que soit la structure des données.
Pour utiliser la première ligne comme noms de colonnes, sélectionnez Avancé>La première ligne est l'en-tête de colonne.

JSON :

Pour déterminer la division des colonnes des données JSON, sélectionnez avancé>niveaux imbriqués, de 1 à 100.
Si vous sélectionnez Avancé>Ignorer les lignes contenant des erreurs, les données sont ingérées au format JSON. Si vous laissez cette case à cocher non sélectionnée, les données sont ingérées au format multijson.

Résumé

Dans la fenêtre Préparation des données, toutes les trois étapes sont marquées avec des coches vertes lorsque l’ingestion des données se termine avec succès. Vous pouvez sélectionner une carte à interroger, supprimer les données ingérées ou afficher un tableau de bord de votre résumé d’ingestion.

Pour gérer votre base de données, consultez Gérer les données
Pour créer, stocker et exporter des requêtes, consultez Données de requête dans un ensemble de requêtes KQL

Partager via

Obtenir des données d’Amazon S3

Conditions préalables

Source

Configurer

Inspecter

Modifier les colonnes

Transformations de cartographie

Options avancées basées sur le type de données

Résumé

Commentaires

Ressources supplémentaires

Partager via

Obtenir des données d’Amazon S3

Conditions préalables

Source

Configurer

Inspecter

Modifier les colonnes

Transformations de cartographie

Options avancées basées sur le type de données

Résumé

Contenu connexe

Commentaires

Ressources supplémentaires