Données dérivées
Les colonnes d’un jeu de données peuvent ne pas fournir suffisamment d’informations pour répondre à une question que nous avons sur nos données. C’est là que les données dérivées sont utiles. Une colonne dérivée est une nouvelle colonne ajoutée à un jeu de données, en fonction des données existantes. Il existe de nombreuses façons de créer une colonne dérivée, et elles offrent la possibilité d’améliorer votre jeu de données pour une analyse plus détaillée. Le type de données du champ dérivé peut être un nombre, une date ou une chaîne.
Vous pouvez utiliser un calcul pour créer une colonne dérivée, qui peut être résumée. Si vous souhaitez calculer la valeur totale d’une ligne de commande, vous multipliez le champ quantité par le champ de prix de vente pour générer la valeur totale sous forme de nouvelle colonne. Ensuite, vous utilisez une fonction d’agrégation pour synthétiser chaque valeur de la colonne dérivée pour retourner la valeur totale de toutes les lignes de commande.
Une colonne dérivée peut être basée sur une condition. Par exemple, si vous souhaitez signaler les ventes de week-end par rapport aux ventes de la semaine, vous pouvez créer un champ en fonction de la date. Si le jour de la semaine était compris entre lundi et vendredi, alors la valeur de la colonne dérivée serait jour de semaine. Sinon, la valeur serait Week-end.
Les valeurs avec une colonne peuvent également être modifiées pour rendre les données cohérentes et plus faciles à analyser.
Dans cette vidéo, vous verrez comment une nouvelle colonne est ajoutée à un jeu de données à l’aide des données actuelles. Vous allez ensuite apprendre à ajouter des données récapitulatives en agrégeant les valeurs de la nouvelle colonne :