Types de données dans Power Query
Les types de données dans Power Query sont utilisés pour classer les valeurs afin d’obtenir un jeu de données plus structuré. Les types de données sont définis au niveau du champ : les valeurs comprises dans un champ sont définies de sorte à être conformes au type de données du champ.
Le type de données d’une colonne apparaît à gauche de son titre sous la forme d’une icône qui le symbolise.
Notes
Power Query propose un ensemble de transformations et d’options contextuelles en fonction du type de données de la colonne. Par exemple, quand vous sélectionnez une colonne dont le type de données est Date, vous obtenez des transformations et des options qui s’appliquent à ce type de données spécifique. Ces transformations et options surviennent dans toute l’interface Power Query, notamment sous les onglets Transformer et Ajouter une colonne et dans les options de filtre intelligent.
Les types de données les plus courants utilisés dans Power Query sont listés dans le tableau suivant. Quand bien même cet article ne prétend pas à l’exhaustivité, vous trouverez la liste complète des types de données dans l’article sur les types en langage de formule M Power Query.
Type de données | Icon | Description |
---|---|---|
Texte | Chaîne de données caractères au format Unicode. Peuvent être des chaînes, des nombres, ou des dates représentées dans un format de texte. La longueur maximale d’une chaîne s’élève à 268 435 456 caractères Unicode (avec deux octets pour chaque caractère Unicode), soit 536 870 912 octets. | |
Vrai/Faux | Valeur booléenne correspondant à Vrai ou à Faux. | |
Nombre décimal | Représente un nombre à virgule flottante de 64 bits (huit octets). Il s’agit du type numérique le plus courant. Il correspond aux nombres tels que vous vous les représentez habituellement. Bien que conçu pour gérer les nombres avec des valeurs fractionnaires, il gère également des nombres entiers. Le type Nombre décimal peut gérer des valeurs négatives comprises entre –1,79E +308 et –2,23E -308, 0, et des valeurs positives comprises entre 2,23E –308 et 1,79E +308. Ainsi, des nombres comme 34, 34.01 et 34.000367063 sont des nombres décimaux valides. La plus grande précision qui peut être représentée dans un type de nombre décimal est de 15 chiffres de long. Le séparateur décimal peut figurer n’importe où dans le nombre. Le type de nombre décimal correspond à la façon dont Excel stocke ses nombres. Notez qu’un nombre à virgule flottante binaire ne peut pas représenter tous les nombres dans sa plage prise en charge avec une précision de 100 %. Ainsi, des différences mineures de précision peuvent se produire lors de la représentation de certains nombres décimaux. | |
Nombre décimal fixe | Également appelé type Devise, ce type de données a un emplacement fixe pour le séparateur décimal. Le séparateur décimal a toujours quatre chiffres à sa droite et permet 19 chiffres de signification. La valeur la plus grande qu’il peut représenter est 922,337,203,685,477.5807 (positif ou négatif). Contrairement au nombre décimal, le type Nombre décimal fixe est toujours précis et donc utile dans les cas où le manque de précision de la notation à virgule flottante risque d’introduire des erreurs. | |
Nombre entier | Représente une valeur entière à 64 bits (huit octets). S’agissant d’un entier, il ne comporte aucun chiffre à droite du séparateur décimal. Il autorise 19 chiffres ; les nombres entiers positifs ou négatifs compris entre –9 223 372 036 854 775 807 (–2^63+1) et 9 223 372 036 854 775 806 (2^63–2). Il peut représenter la précision la plus large possible des différents types de données numériques. Comme le type Nombre décimal fixe, le type Nombre entier peut s’avérer utile dans les cas où vous avez besoin de contrôler l’arrondi. | |
Percentage | Fondamentalement identique au type Nombre décimal, si ce n’est qu’il comporte un masque pour formater les valeurs dans la colonne sous forme de pourcentage dans la fenêtre de l’éditeur Power Query. | |
Date/Heure | Représente une valeur à la fois de date et d’heure. Dans les faits, une valeur Date/Heure est stockée en tant que type Nombre décimal. Vous pouvez donc effectuer une conversion de l’un à l’autre. La partie temporelle d’une date est stockée sous forme de fraction à des multiples entiers de 1/300 secondes (3,33 ms). Les dates comprises entre les années 1900 et 9999 sont prises en charge. | |
Date | Représente seulement une date (aucune partie heure). Lorsqu’elle est convertie dans le modèle, une date est identique à une valeur de date/heure avec zéro pour la valeur fractionnaire. | |
Heure | Représente seulement une heure (aucune partie date). Une fois convertie dans le modèle, une valeur Time est identique à une valeur Date/Heure sans chiffres à gauche de la décimale. | |
Date/Heure/Fuseau horaire | Représente une date/heure en temps universel coordonné (UTC) avec un décalage de fuseau horaire. Ce type est converti en Date/Heure pendant le chargement dans le modèle. | |
Durée | Représente une durée, qui est convertie en type Nombre décimal lors du chargement dans le modèle. En tant que type Nombre décimal, il peut être additionné ou soustrait d’un champ Date/Heure avec des résultats corrects. S’agissant d’un type Nombre décimal, vous pouvez facilement l’utiliser dans des visualisations qui montrent un ordre de grandeur. | |
Binaire | Le type de données binaires peut être utilisé pour représenter toute autre donnée avec un format binaire. | |
N’importe lequel/laquelle | Le type de données Tout type correspond à l’état donné à une colonne dont le type de données n’est pas explicitement défini. Le type Tout type est celui qui classe toutes les valeurs. Nous vous recommandons de toujours définir explicitement les types de données des colonnes pour vos requêtes à partir de sources non structurées et d’éviter d’avoir des colonnes de type Tout type comme sortie de votre requête. |
La détection du type de données se produit automatiquement lors de la connexion aux sources suivantes :
Sources de données structurées comme des bases de données : Power Query lit le schéma de table à partir de la source de données et affiche automatiquement les données à l’aide du type de données correct pour chaque colonne.
Sources non structurées comme des fichiers Excel, CSV et texte : Power Query détecte automatiquement les types de données en inspectant les valeurs dans la table. Par défaut, la détection automatique du type de données est activée dans Power Query pour les sources non structurées.
Vous pouvez également utiliser la commande Détecter le type de données dans le groupe N’importe quelle colonne sous l’onglet Transformer pour détecter automatiquement les types de données des colonnes de votre table.
Vous pouvez définir ou modifier le type de données d’une colonne à quatre emplacements :
Sous l’onglet Accueil, dans le groupe Transformer, dans le menu déroulant Type de données.
Sous l’onglet Transformer, dans le groupe N’importe quelle colonne, dans le menu déroulant Type de données.
En sélectionnant l’icône située à gauche du titre de la colonne.
Dans le menu contextuel de la colonne, sous Modifier le type.
Ce paramètre est spécifiquement destiné aux sources non structurées. Il vous permet d’inspecter et de détecter automatiquement les types et en-têtes de colonne en fonction des 200 premières lignes de votre table. Quand ce paramètre est activé, Power Query ajoute automatiquement deux étapes à votre requête :
- Promouvoir les en-têtes de colonne : Promeut la première ligne de la table en tant qu’en-tête de colonne.
- Type modifié : Convertit les valeurs du type de données Tout type en un autre type de données selon l’inspection des valeurs de chaque colonne.
Par défaut, ce paramètre est activé. Pour désactiver ou activer ce paramètre, suivez les étapes applicables à votre expérience Power Query.
Pour configurer la détection automatique du type de données dans Power Query Online
Sous l’onglet Accueil, sélectionnez Options, puis Options du projet. Dans la fenêtre Options du project, cochez la case Détecter automatiquement les types et en-têtes de colonne pour les sources non structurées.
Pour configurer la détection automatique du type de données dans Power Query for Desktop
Vous pouvez définir ce comportement à la fois globalement et fichier par fichier dans la fenêtre Options (dans l’éditeur Power Query, sous l’onglet Fichier, sélectionnez Options et paramètres>Options).
Global : Dans le volet gauche sous Global, sélectionnez Chargement des données. Dans le volet droit sous Détection du type, vous pouvez sélectionner l’une des trois configurations de détection du type à appliquer à chaque nouveau fichier créé dans votre application :
- Toujours détecter les types de colonnes et d’en-têtes pour les sources non structurées
- Détecter les types de colonnes et d’en-têtes pour les sources non structurées en fonction du paramètre de chaque fichier
- Ne jamais détecter les types de colonnes et d’en-têtes pour les sources non structurées
Fichier actif : Dans le volet gauche sous Fichier actif, sélectionnez Chargement des données. Dans le volet droit sous Détection du type, indiquez si vous voulez activer ou désactiver la détection du type pour le fichier actif.
Power Query prend en charge deux composants distincts qui gèrent l’apparence et la manière d’interpréter les valeurs :
- Localisation : composant qui indique à Power Query sa langue d’affichage.
- Globalisation : composant qui gère le formatage des valeurs, en plus de l’interprétation des valeurs texte.
Les paramètres régionaux correspondent à une valeur unique qui contient à la fois les composants localisation et globalisation. Les paramètres régionaux sont utilisés pour interpréter les valeurs texte et les convertir en d’autres types de données. Par exemple, les paramètres régionaux Anglais (États-Unis) signifient que la localisation est en anglais américain et que la globalisation, ou le format de la valeur, se base sur les normes utilisées aux États-Unis.
Quand Power Query définit le type de données d’une colonne ou convertit un type de données, il doit interpréter les valeurs à convertir avant de pouvoir les transformer en un autre type de données.
Dans Power Query Online, cette interprétation est définie dans les options du projet, sous Paramètres régionaux.
Power Query for Desktop reconnaît automatiquement le format régional de votre système d’exploitation et l’utilise pour interpréter les valeurs lors de la conversion des types de données. Pour remplacer cette configuration des paramètres régionaux, ouvrez la fenêtre Options, puis, dans le volet gauche, sous Fichier actif, sélectionnez Paramètres régionaux. À partir de là, vous pouvez remplacer les paramètres régionaux selon vos besoins.
La définition de ces paramètres régionaux est importante pour interpréter les valeurs texte dans un type de données spécifique. Par exemple, imaginez que vos paramètres régionaux sont définis sur Anglais (États-Unis), alors qu’une colonne dans l’un de vos fichiers CSV comporte des dates au format britannique jour/mois/année.
Quand vous essayez de définir le type de données de la colonne Date sur Date, vous obtenez des valeurs d’erreur.
Ces erreurs se produisent car les paramètres régionaux utilisés tentent d’interpréter la date au format Anglais (États-Unis), à savoir mois/jour/année. Étant donné qu’il n’existe pas de mois 22 dans le calendrier, une erreur est générée.
Au lieu d’essayer de sélectionner simplement le type de données Date, vous pouvez cliquer avec le bouton droit sur le titre de la colonne, sélectionner Modifier le type, puis sélectionner Utilisation des paramètres régionaux.
Dans la boîte de dialogue Changer le type de colonne avec les paramètres régionaux, vous sélectionnez le type de données à définir, mais vous sélectionnez également les paramètres régionaux à utiliser, à savoir Anglais (Royaume-Uni) dans cet exemple.
Avec ces paramètres régionaux, Power Query va être en mesure d’interpréter correctement les valeurs et de les convertir dans le type de données approprié.
Pour vérifier les valeurs de date finales
Le formatage des valeurs dépend de la valeur de la globalisation. En cas de doute sur la valeur affichée par Power Query, vous pouvez vérifier la conversion des valeurs de date en ajoutant de nouvelles colonnes pour le jour, le mois et l’année de la valeur. Pour cela, sélectionnez la colonne Date et accédez à l’onglet Ajouter une colonne dans le ruban. Dans le groupe Colonne de date et d’heure, vous allez voir les options d’une colonne de date.
À partir de là, vous pouvez extraire des parties de la valeur de date, comme le numéro de l’année, le numéro du mois, le numéro du jour ou même d’autres colonnes extraites de la colonne Date.
En utilisant ces colonnes, vous pouvez vérifier que votre valeur de date a été correctement convertie.
La matrice suivante est conçue pour vous donner un aperçu rapide de la faisabilité de la conversion d’une valeur d’un type de données vers un autre.
Notes
La conversion dans cette matrice débute par le type de données d’origine dans la colonne Types de données. Chaque résultat d’une conversion vers le nouveau type est indiqué dans la ligne du type de données d’origine.
Types de données | |||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|
Nombre décimal | — | ||||||||||
Devise | — | ||||||||||
Nombre entier | — | ||||||||||
Pourcentage | — | ||||||||||
Date/Heure | — | ||||||||||
Date | — | ||||||||||
Heure | — | ||||||||||
Date/Heure/Fuseau horaire | — | ||||||||||
Durée | — | ||||||||||
Text | — | ||||||||||
Vrai/Faux | — |
Icon | Description |
---|---|
Possible | |
Impossible | |
Possible, mais des valeurs sont ajoutées à la valeur d’origine | |
Possible, mais la valeur d’origine est tronquée |