Agregar datos
Las funciones de agregado se usan para devolver un valor de resumen del conjunto de datos y son un componente fundamental del análisis de datos. Estas funciones nos ayudan a responder preguntas específicas sobre nuestro negocio, como el número de clientes que visitaron la tienda de Tokio el martes pasado, o el gasto medio de cada cliente en línea en diciembre.
Las funciones siguientes se usan normalmente en el análisis de datos:
Count: un buen punto de partida antes de comenzar un análisis más detallado es usar la función count para devolver el número de registros del conjunto de datos. La función count se puede aplicar a cualquier conjunto de datos, independientemente del tipo de datos que contenga, ya que el cálculo se realiza en el número de filas.
Count distinct: se puede aplicar un recuento distinto para devolver el número de valores únicos dentro de una columna y resulta útil para los datos de categorías.
Sum : una función común que resume los valores totales dentro de un campo. Se usa para devolver valores como ventas totales o ingresos.
Promedio : la función media calcula la suma de un campo, dividido por el número de registros. Por ejemplo, para detectar el gasto medio de clientes, la función media ejecutaría un cálculo de suma con respecto al gasto de todos los clientes y, a continuación, lo dividiría por el número de clientes de la tabla.
Mínimo : función que se usa para devolver el valor más bajo en un campo.
Máximo : lo contrario a la función mínima, esta función devuelve el valor más alto de un campo.
El tipo de función usada depende de los datos de la columna que se va a agregar. Los valores de temperatura de una columna no funcionarían con una agregación de resumen, pero serían ideales para el mínimo, máximo o promedio. En una tabla de pedidos de ventas, se puede resumir la columna total o usar las funciones mínimas, máximas o medias.
En este vídeo, verá cómo se pueden aplicar funciones de agregado a los datos para devolver resultados resumidos: