Introducción a los datos
Un conjunto de datos es una colección de datos organizados en filas y columnas, a menudo denominados tabla. Las filas también se conocen como registros y columnas como campos. Los puntos de datos componen los campos de un conjunto de datos que normalmente componen diferentes tipos de datos:
Datos temporales: Los datos temporales son fechas registradas en relación con un evento, como cuando se realizó un pedido o se envió un paquete. Las fechas tienen un orden natural y sabemos que el 24/12/2021 viene antes del 25/12/2021 y después del 12/23/2021. Debido a este orden natural, es fácil medir los valores a lo largo del tiempo.
Datos de cadena: un valor de texto también se conoce como datos de caracteres o cadenas, y a menudo se clasifica como datos categóricos. Esto se debe a que describe categorías de registros dentro del conjunto de datos. Por ejemplo, el nombre de un empleado se almacenaría como datos de cadena.
Datos numéricos : los datos numéricos o los números pueden ser clasificados como continuos o discretos. Los datos continuos son algo que se mide en una escala y los datos discretos son valores que se cuentan en lugar de medidos. Dependiendo de los valores de una columna numérica, este tipo se puede usar como categoría.
Es importante que comprenda los datos del conjunto de datos antes de analizarlos. A continuación, puede elegir las funciones analíticas correctas para aplicar a los tipos de datos con los que está trabajando.
En este vídeo, verá un ejemplo de un conjunto de datos y cómo los distintos tipos de campos date, string y numéricos se combinan en filas y columnas. Obtendrá información sobre cómo se puede realizar el análisis en un conjunto de datos para comprender los patrones de los datos: