Prise en main des données

Effectué

Un jeu de données est une collection de données organisées en lignes et en colonnes, souvent appelée table. Les lignes sont également appelées des enregistrements, et les colonnes des champs. Les points de données composent les champs d’un jeu de données qui comprennent généralement différents types de données :

  • Données temporelles : les données temporelles sont des dates conservées par rapport à un événement, par exemple lorsqu’une commande a été passée ou qu’un colis a été expédié. Les dates ont un ordre naturel, et nous savons que 12/24/2021 arrive avant 12/25/2021, et après 12/23/2021. En raison de cet ordre naturel, il est facile de mesurer les valeurs au fil du temps.

  • Données de chaîne : une valeur de texte est également appelée données de caractère ou de chaîne, et est souvent classifiée comme des données catégorielles. Cela est dû au fait qu’il décrit les catégories d’enregistrements dans le jeu de données. Par exemple, le nom d’un employé est stocké sous forme de données de chaîne.

  • Données numériques : les données numériques ou les nombres peuvent être classés en tant que données continues ou discrètes. Les données continues sont quelque chose que nous mesurons à l’échelle, et les données discrètes sont des valeurs qui sont comptées plutôt que mesurées. Selon les valeurs d’une colonne numérique, ce type peut être utilisé comme catégorie.

Il est important de comprendre les données de votre jeu de données avant de les analyser. Vous pouvez ensuite choisir les fonctions analytiques appropriées à appliquer aux types de données avec lesquels vous travaillez.

Dans cette vidéo, vous verrez un exemple de jeu de données et comment les différents types de champs date, chaîne et numérique se combinent en lignes et en colonnes. Vous découvrirez comment l’analyse peut être effectuée sur un jeu de données pour comprendre les modèles au sein des données :