Identificación de valores atípicos con objetos visuales de Power BI

Completado

Un valor atípico es un tipo de anomalía en los datos, algo que no esperaba o que le ha sorprendido, según promedios o resultados históricos. Querrá identificar los valores atípicos para aislar los puntos de datos que difieran significativamente de otros y, luego, adoptar medidas para investigar el motivo de las diferencias. Los resultados de este análisis pueden tener un impacto considerable en la toma de decisiones empresariales.

Imagine un escenario en el que va a analizar los datos de un almacén de envíos. Observa que el número de pedidos en una categoría de productos concreta ha superado la media. En primer lugar, quiere identificar la categoría de producto. Después, le interesa hacer varias preguntas sobre el valor atípico:

  • ¿Ese día se produjeron envíos por encima de la media?

  • ¿Se produjo esta anomalía en un almacén específico?

  • ¿Un único evento fue el responsable del aumento en los pedidos de esa categoría concreta?

  • ¿Se ha producido un evento como este otros días durante el último mes, trimestre, año o en el año anterior?

Power BI le permite identificar valores atípicos en los datos, pero primero debe determinar la lógica subyacente de lo que constituye un valor atípico. Puede usar puntos de desencadenador, como cálculos, en torno a lo que se consideraría el valor atípico.

El proceso de identificación de valores atípicos implica segmentar los datos en dos grupos: uno son los datos del valor atípico y el otro no. Podría usar columnas calculadas para identificar los valores atípicos, pero los resultados serían estáticos hasta que actualizara los datos. Una manera más indicada de identificar los valores atípicos consiste en usar una visualización o una fórmula DAX, puesto que estos métodos garantizarán que los resultados sean dinámicos.

Una vez identificados los valores atípicos en los datos, puede usar segmentaciones o filtros para resaltar esos valores atípicos. Además, puede agregar una leyenda a los objetos visuales, de modo que los valores atípicos se puedan identificar entre los demás datos. Después, puede profundizar en los datos de valores atípicos para realizar un análisis más detallado.

Uso de un objeto visual para identificar valores atípicos

El mejor objeto visual que puede usar para identificar valores atípicos es el gráfico de dispersión, el cual muestra la relación entre dos valores numéricos. Los gráficos de dispersión muestran patrones en grandes conjuntos de datos y, por tanto, resultan idóneos para mostrar valores atípicos.

Cuando se agrega un gráfico de dispersión a un informe de Power BI, los campos de interés se colocan en las secciones Eje X y Eje Y, respectivamente. En este caso, el campo Orders Shipped (Pedidos enviados) está en el eje X y el campo Qty Orders (Cantidad de pedidos) en el eje Y.

Captura de pantalla de adición de campos para rellenar un gráfico de dispersión

El objeto visual se actualizará para mostrar los datos en función de los campos seleccionados y podrá identificar con claridad los valores atípicos en los datos; son los elementos aislados alejados del grueso de los datos.

Captura de pantalla de un gráfico de dispersión con valores atípicos

Ahora que puede identificar los valores atípicos en los datos, puede investigar las causas de su existencia y tomar medidas correctivas.

Uso de DAX para identificar valores atípicos

Puede usar DAX para crear una medida que identifique los valores atípicos de los datos, como en la fórmula siguiente:

Outliers =
CALCULATE (
    [Order Qty],
    FILTER (
        VALUES ( Product[Product Name] ),
        COUNTROWS ( FILTER ( Sales, [Order Qty] >= [Min Qty] ) ) > 0
    )
)

Order Qty es una medida de la tabla Sales y Min Qty hace referencia a la cantidad de pedidos más baja de la tabla Sales.

Una vez que ha creado una medida de valores atípicos, puede agrupar los productos en categorías mediante la característica de agrupación, como ha hecho anteriormente al crear un histograma. Después, debe agregar un objeto visual de gráfico de dispersión, como en la sección anterior, puesto que es la mejor opción de visualización para mostrar valores atípicos. Cuando haya agregado el gráfico de dispersión, lo rellenará con los campos asociados a la fórmula DAX y la medida de valores atípicos.

Captura de pantalla de selección de campos de lógica de valores atípicos que se usarán en un gráfico de dispersión

En el gráfico de dispersión, podrá identificar los valores atípicos en los datos. Después, puede investigar las causas de su existencia y tomar medidas correctivas.

Captura de pantalla de un gráfico de dispersión para rellenar valores atípicos