Trier et filtrer les données

Effectué

Nous analysons les données pour répondre à une question métier ou trouver une histoire dans les données. Le tri et le filtrage des données nous aident à atteindre cet objectif. Par exemple, combien de ventes ont été réalisées dans le magasin de New York le lundi ? Ou combien de paquets ont été expédiés à partir de l’entrepôt le vendredi ?

Le filtrage exclut les lignes du jeu de résultats qui ne répondent pas à la question que nous posons. Si nous filtrons tous les magasins à l’exception de New York, nous pouvons ensuite analyser les résultats d’un jeu de données plus petit et compter le nombre de ventes effectuées. Nous pouvons filtrer sur n’importe quelle colonne d’un jeu de données, quel que soit le type de données de cette colonne.

En triant le jeu de données, nous pouvons trouver la valeur la plus élevée ou la plus basse dans une colonne. Le tri peut être effectué sur n’importe quel type de données, mais il est souvent effectué sur une date ou un type de nombre, pour répondre à une question telle que le plus grand nombre de ventes. Les données de chaîne peuvent être triées par ordre alphabétique dans l’ordre croissant ou décroissant.

Les valeurs hors norme sont des valeurs inhabituellement élevées ou faibles par rapport aux autres valeurs du jeu de données. Lorsqu’une valeur hors norme est incluse dans une fonction d’agrégation, telle qu’une moyenne, elle peut créer des résultats trompeurs.

Dans cette vidéo, vous verrez comment un jeu de données peut être filtré pour répondre à une question et comment les colonnes peuvent être triées pour découvrir les valeurs les plus élevées et les plus basses au sein d’une plage :