Ordenar y filtrar datos
Analizamos los datos para responder a una pregunta empresarial o encontrar una historia dentro de los datos. La ordenación y el filtrado de datos nos ayudan a lograr este objetivo. Por ejemplo, ¿cuántas ventas se realizaron en la tienda de Nueva York el lunes? ¿O cuántos paquetes se enviaron desde el almacén el viernes?
El filtrado excluye las filas del conjunto de resultados que no responden a la pregunta que estamos haciendo. Si filtramos todas las tiendas excepto Nueva York, podemos analizar los resultados de un conjunto de datos más pequeño y contar cuántas ventas se realizaron. Podemos filtrar por cualquier columna de un conjunto de datos, independientemente del tipo de datos de esa columna.
Al ordenar el conjunto de datos, podemos encontrar el valor más alto o más bajo dentro de una columna. La ordenación se puede realizar en cualquier tipo de datos, pero a menudo se realiza en un tipo de fecha o número, para responder a una pregunta como el mayor número de ventas. Los datos de cadena se pueden ordenar alfabéticamente en orden ascendente o descendente.
Los valores atípicos son valores inusualmente altos o bajos en comparación con los demás valores del conjunto de datos. Cuando se incluye un valor atípico en una función de agregado, como un promedio, puede crear resultados engañosos.
En este vídeo, verá cómo se puede filtrar un conjunto de datos para responder a una pregunta y cómo se pueden ordenar las columnas para detectar los valores más altos y mínimos dentro de un intervalo: