Uso de las herramientas de generación de perfiles de datos

Las herramientas de generación de perfiles de datos proporcionan nuevas e intuitivas formas de limpiar, transformar y comprender los datos en Editor de Power Query. Incluyen:

  • Calidad de columnas

  • Distribución de columnas

  • Perfil de columna

Para habilitar las herramientas de generación de perfiles de datos, vaya a la pestaña Ver de la cinta de opciones. Habilite las opciones que desee en el grupo Vista previa de datos , como se muestra en la imagen siguiente.

Herramientas de generación de perfiles de datos.

Después de habilitar las opciones, verá algo parecido a la imagen siguiente en Editor de Power Query.

Herramientas de generación de perfiles de datos habilitadas.

Nota

De forma predeterminada, Power Query realizará esta generación de perfiles de datos en las primeras 1000 filas de los datos. Para que funcione en todo el conjunto de datos, compruebe la esquina inferior izquierda de la ventana del editor para cambiar cómo se realiza la generación de perfiles de columnas.

Calidad de columnas

Los valores de las etiquetas de características de calidad de columna en filas de cinco categorías:

  • Válido, que se muestra en verde.

  • Error, que se muestra en rojo.

  • Vacío, mostrado en gris oscuro.

  • Desconocido, que se muestra en verde discontinuo. Indica cuándo hay errores en una columna, se desconoce la calidad de los datos restantes.

  • Error inesperado, que se muestra en rojo discontinuo.

Estos indicadores se muestran directamente debajo del nombre de la columna como parte de un gráfico de barras pequeño, como se muestra en la imagen siguiente.

Vista mejorada del gráfico de barras con indicadores y etiquetas de calidad de datos por encima de cada columna de la tabla.

El número de registros de cada categoría de calidad de columna también se muestra como un porcentaje.

Al mantener el puntero sobre cualquiera de las columnas, se le presenta la distribución numérica de la calidad de los valores en toda la columna. Además, al seleccionar el botón de puntos suspensivos (...) se abren algunos botones de acción rápida para las operaciones en los valores.

Distribución de la columna de nombres con 701 nombres válidos (100 por ciento), cero errores y cero vacíos, con comandos de acción rápida mostrados.

Distribución de columnas

Esta característica proporciona un conjunto de objetos visuales debajo de los nombres de las columnas que muestran la frecuencia y distribución de los valores en cada una de las columnas. Los datos de estas visualizaciones se ordenan en orden descendente del valor con la frecuencia más alta.

Distribución de columnas.

Al mantener el puntero sobre los datos de distribución en cualquiera de las columnas, obtendrá información sobre los datos generales de la columna (con valores únicos y recuento distintos). También puede seleccionar el botón de puntos suspensivos y elegir entre un menú de operaciones disponibles.

Opciones de distribuciones de columnas.

Perfil de columna

Esta característica proporciona una visión más detallada de los datos de una columna. Aparte del gráfico de distribución de columnas, contiene un gráfico de estadísticas de columnas. Esta información se muestra debajo de la sección de vista previa de datos, como se muestra en la imagen siguiente.

Perfil de columna.

Filtrar por valor

Puede interactuar con el gráfico de distribución de valores en el lado derecho y seleccionar cualquiera de las barras si mantiene el puntero sobre las partes del gráfico.

Mantenga el puntero sobre la barra en el gráfico de barras de distribución de valores, que muestra datos individuales para esa barra.

Haga clic con el botón derecho para mostrar un conjunto de transformaciones disponibles para ese valor.

Muestra el menú contextual con tranformaciones disponibles para una sola barra en el gráfico de barras de distribución de valores.

Copia de datos

En la esquina superior derecha de las secciones estadísticas de columna y distribución de valores, puede seleccionar el botón de puntos suspensivos (...) para mostrar un menú contextual Copiar . Selecciónelo para copiar los datos que se muestran en cualquiera de las secciones en el Portapapeles.

Copiar estadísticas de columna.

Agrupar por valor

Al seleccionar el botón de puntos suspensivos (...) en la esquina superior derecha del gráfico de distribución de valores, además de Copiar , puede seleccionar Agrupar por. Esta característica agrupa los valores del gráfico mediante un conjunto de opciones disponibles.

Agrupar por distribución de valores.

En la imagen siguiente se muestra una columna de nombres de producto agrupados por longitud de texto. Una vez agrupados los valores en el gráfico, puede interactuar con valores individuales en el gráfico, tal y como se describe en Filtro por valor.

Nuevo gráfico de barras que muestra la distribución de la longitud de texto de los nombres de almacén en la columna Nombres de la tabla.