Procedimientos recomendados al trabajar con Power Query

Este artículo contiene algunos consejos y trucos para aprovechar al máximo su experiencia con la disputa de datos en Power Query.

Elija el conector correcto

Power Query ofrece una gran cantidad de conectores de datos. Estos conectores abarcan desde los orígenes de datos tales como archivos TXT, CSV y Excel, hasta las bases de datos como el Servidor Microsoft SQL y los servicios SaaS populares como Microsoft Dynamics 365 y Salesforce. Si no ve su fuente de datos en la lista de la ventana de Obtener Datos, siempre puede usar el conector ODBC u OLEDB para conectarse a su fuente de datos.

Usar el mejor conector para la tarea le proporcionará la mejor experiencia y rendimiento. Por ejemplo, el uso del conector del Servidor SQL en lugar del conector ODBC al conectarse a una base de datos del Servidor SQL no solo le proporciona una experiencia mucho mejor de Obtener Datos, pero el Servidor SQL del conector también le ofrece características que pueden mejorar su experiencia y rendimiento, tal como el plegado de consultas. Para obtener más información acerca del plegado de consultas, vaya a Información general sobre la evaluación de consultas y el plegado de consultas de Power Query.

Cada conector de datos sigue una experiencia estándar como se explica en la Obtención de datos. Esta experiencia estandarizada tiene una etapa llamada Vista Previa de Datos. En esta etapa, se le proporciona una ventana fácil de usar para seleccionar los datos que desea obtener de su fuente de datos, si el conector lo permite, y una vista previa de datos simple de esos datos. Incluso puede seleccionar varios conjuntos de datos de su fuente de datos a través de la ventana del Navegador, como se muestra en la siguiente imagen.

Ventana Navegador de ejemplo.

Nota:

Para ver la lista completa de conectores disponibles en Power Query, vaya hasta los Conectores de Power Query.

Filtrar temprano

Siempre se recomienda filtrar los datos en las primeras etapas de la consulta o lo antes posible. Algunos conectores aprovecharán los filtros mediante el plegado de consultas, tal como se describe en el Información general sobre la evaluación de consultas y el plegado de consultas de Power Query. También es una práctica recomendada de filtrar cualquier dato que no sea relevante para su caso. Esto le permitirá concentrarse mejor en su tarea en cuestión al mostrar solo los datos que son relevantes en la sección de la vista previa de datos.

Puede usar el menú de filtro automático que muestra una lista distinta de los valores encontrados en la columna para seleccionar los valores que desea conservar o filtrar. También puede utilizar la barra de búsqueda para encontrar los valores de la columna.

Menú Filtro automático en Power Query.

También puede aprovechar los filtros específicos tipo, como en una columna de fecha anterior, con la fecha y hora o incluso con la fecha de la zona horaria.

escriba un filtro específico para una columna de fecha.

Estos filtros específicos tipo pueden ayudarlo a crear un filtro dinámico que siempre recuperará los datos que se encuentran en el archivo anterior de x número de segundos, minutos, horas, días, semanas, meses, trimestres o años como se muestra en la siguiente imagen.

Está en el filtro específico de fecha anterior.

Nota:

Para obtener mayor información acerca de cómo filtrar los datos en función de los valores de una columna, vaya a Filtrar por valores.

Hacer operaciones costosas al final

Ciertas operaciones requieren de la lectura de la fuente de datos completa para poder devolver cualquiera de los resultados y, por lo tanto, será lento para obtener una vista previa en el editor de Power Query. Por ejemplo, si realiza un orden, es posible que las primeras filas ordenadas estén al final de los datos de origen. Por lo tanto, para devolver cualquier resultado, la operación de clasificación debe leer primero todas las filas.

Otras operaciones (como los filtros) no tienen que leer todos los datos antes de devolver los resultados. En cambio, operan sobre los datos llamados forma de "transmisión". Los datos se "transmiten" por, y los resultados se devuelven a lo largo del camino. En el editor de Power Query, estas operaciones solo tienen que leer lo suficiente de los datos de origen para llenar la vista previa.

Cuando sea posible, realice primero dichas operaciones de transmisión y, al final, realice cualquier operación más costosa. Esto ayudará a minimizar la cantidad de tiempo que pasa esperando a que se procese la vista previa cada vez que agrega un nuevo paso a su consulta.

Trabajar temporalmente con un subconjunto de sus datos

Si agregar nuevos pasos a la consulta en el editor de Power Query es lento, considere primero realizar una operación de "Mantener las primeras filas" y limitar el número de filas con las que está trabajando. Luego, una vez que haya agregado todos los pasos que necesita, elimine el paso de "Mantener las primeras filas".

Utilice los tipos de datos correctos

Algunas características de Power Query son contextuales al tipo de datos de la columna seleccionada. Por ejemplo, al seleccionar una columna de fecha, las opciones disponibles en la columna del grupo de la fecha y hora en la columna Añadir donde el menú estará disponible. Pero si la columna no tiene un conjunto de tipos de datos, estas opciones aparecerán atenuadas.

Escriba una opción específica en el menú Agregar columna.

Una situación similar ocurre con los filtros específicos tipo, ya que son específicos de ciertos tipos de datos. Si la columna no tiene definido el tipo de datos correcto, estos filtros específicos tipo no estarán disponibles.

escriba un filtro específico para una columna de fecha.

Es crucial que siempre trabaje con los tipos de datos correctos para sus columnas. Al trabajar con las fuentes de datos estructuradas, como bases de datos, la información del tipo de datos se obtendrá del esquema de la tabla que se encuentra en la base de datos. Sin embargo, para las fuentes de datos no estructuradas, como los archivos TXT y CSV, es importante que establezca los tipos de datos correctos para las columnas que provienen de esa fuente de datos. De forma predeterminada, Power Query ofrece una detección automática de los tipos de datos para los orígenes de datos no estructurados. Puede leer más acerca de esta función y cómo puede ayudarlo con los Tipos de datos.

Nota:

Para obtener mayor información acerca de la importancia de los tipos de datos y cómo trabajar con ellos, consulte los Tipos de datos.

Exploración de los datos

Antes de comenzar a preparar sus datos y agregar nuevos pasos de transformación, le recomendamos que habilite las herramientas de generación de perfiles de datos de Power Query para detectar fácilmente información acerca de sus datos.

Herramientas de generación de perfiles de datos o versión preliminar de datos en Power Query.

Estas herramientas de creación de los perfiles de datos lo ayudan a comprender mejor sus datos. Las herramientas le proporcionan pequeñas visualizaciones que le muestran la información por columna, como:

  • Calidad de la columna; proporciona un pequeño gráfico de barras y tres indicadores con la representación de cuántos valores de la columna se incluyen en las categorías de valores válidos, de error o vacíos.
  • Distribución de columnas; proporciona un conjunto de elementos visuales debajo de los nombres de las columnas que muestran la frecuencia y la distribución de los valores en cada una de las columnas.
  • Perfil de la columna; proporciona una vista más completa de su columna y las estadísticas asociadas a ella.

También puede interactuar con estas funciones, que le ayudarán a preparar sus datos.

Opciones para mover el puntero sobre la calidad de los datos.

Nota:

Para obtener mayor información acerca de las herramientas de creación de los perfiles de datos, vaya hasta las Herramientas de creación de perfiles de datos.

Documente su trabajo

Le recomendamos que documente sus consultas cambiando el nombre o agregando una descripción a sus pasos, consultas o grupos como mejor le parezca.

Si bien Power Query crea automáticamente un nombre del paso para usted en el panel de pasos aplicados, también puede cambiar el nombre de los pasos o agregar una descripción a cualquiera de ellos.

Panel Pasos aplicados con pasos documentados y descripción agregados.

Nota:

Para obtener mayor información acerca de todas las funciones y componentes disponibles que se encuentran en el panel de pasos aplicados, vaya hasta el Uso de la lista de pasos aplicados.

Adopte un enfoque modular

Es completamente posible crear una sola consulta que contenga todas las transformaciones y cálculos que pueda necesitar. Pero si la consulta contiene una gran cantidad de pasos, entonces podría ser una buena idea dividir la consulta en varias consultas, donde una consulta hace referencia a la siguiente. El objetivo de este enfoque es simplificar y desacoplar las fases de transformación en piezas más pequeñas para que sean más fáciles de entender.

Por ejemplo, supongamos que tiene una consulta con los nueve pasos que se muestran en la siguiente imagen.

Panel Pasos aplicados con pasos documentados y descripción agregados.

Puede dividir esta consulta en dos pasos en Combinar con la tabla de precios. De esta forma, es más fácil comprender los pasos que se aplicaron a la consulta de ventas antes de la fusión. Para realizar esta operación, haga clic con el botón derecho en el paso Combinar con la tabla de precios y seleccione la opción Extraer el Anterior.

Extraiga el paso anterior.

A continuación, aparecerá un cuadro de diálogo en el cual se le pedirá que le asigne un nombre a la nueva consulta. Esto dividirá efectivamente su consulta en dos consultas. Una consulta tendrá todas las consultas antes de la fusión. La otra consulta tendrá un paso inicial que hará referencia a su nueva consulta y al resto de los pasos que tenía en su consulta original del paso Combinar con la tabla de precios hacia abajo.

Consulta original después de la acción para extraer el paso anterior.

También puede aprovechar el uso de referencias de consulta como mejor le parezca. Pero es una buena idea mantener sus consultas a un nivel que no parezca desalentador a primera vista con tantos pasos.

Nota:

Para obtener mayor información acerca de la referencia de consultas, vaya hasta la Descripción del panel de consultas.

Creación de grupos

Una excelente manera de mantener su trabajo organizado es aprovechando el uso de grupos en el panel de consultas.

Uso de grupos en Power Query.

El único propósito de los grupos es ayudarlo a mantener su trabajo organizado al servirle como carpetas para sus consultas. Puede crear grupos dentro de grupos si alguna vez lo necesita. Mover las consultas entre grupos es tan fácil como arrastrar y soltar.

Trate de darle a sus grupos un nombre significativo que tenga sentido para usted y su caso.

Nota:

Para obtener mayor información acerca de todas las funciones y componentes disponibles que se encuentran en el panel de consultas, vaya hasta la Descripción del panel de consultas.

Consultas a prueba de futuro

Asegurarse de crear una consulta que no tenga problemas durante una actualización futura es una prioridad máxima. Hay varias características en Power Query para que su consulta sea resistente a los cambios y pueda actualizarse incluso cuando cambien algunos componentes de su fuente de datos.

Es una práctica recomendada definir el alcance de su consulta en cuanto a lo que debe hacer y lo que debe tener en cuenta en términos de estructura, diseño, nombres de la columna, tipos de datos y cualquier otro componente que considere relevante para el alcance.

Algunos ejemplos de transformaciones que pueden ayudarlo a hacer que su consulta sea resistente a los cambios son:

  • Si su consulta tiene un número dinámico de filas con datos, pero un número fijo de filas que sirven como pie de página que debe eliminarse, puede usar la característica Eliminar filas inferiores.

    Nota:

    Para obtener mayor información acerca de cómo filtrar los datos por posición de fila, vaya a Filtrar una tabla por posición de fila.

  • Si su consulta tiene un número dinámico de columnas, pero solo tiene que seleccionar columnas específicas de su conjunto de datos, puede usar la característica Elegir columnas.

    Nota:

    Para obtener mayor información acerca de cómo elegir o eliminar columnas, vaya hasta Elegir o eliminar columnas.

  • Si su consulta tiene un número dinámico de columnas y tiene que desvincular solo un subconjunto de sus columnas, puede usar la característica de desvincular solo las columnas seleccionadas.

    Nota:

    Para obtener mayor información acerca de las opciones para desvincular sus columnas, vaya hasta las Columnas Unpivot.

  • Si la consulta tiene un paso que cambia el tipo de datos de una columna, pero algunas celdas arrojan errores porque los valores no se ajustan al tipo de datos deseado, puede quitar las filas que arrojaron los valores de error.

    Nota:

    Para obtener mayor información acerca de cómo trabajar y lidiar con los errores, vaya hasta Lidiando con errores.

Usar parámetros

Crear consultas dinámicas y flexibles es una práctica recomendada. Los parámetros de Power Query le ayudan a hacer que sus consultas sean más dinámicas y flexibles. Un parámetro sirve como una forma de almacenar y administrar fácilmente un valor que se puede reutilizar de muchas maneras diferentes. Pero se usa más comúnmente en dos escenarios:

  • Argumento del paso; puede utilizar un parámetro como argumento de varias transformaciones impulsadas desde la interfaz del usuario.

    Seleccione el parámetro para el argumento de transformación.

  • Argumento de la función personalizada; puede crear una nueva función a partir de una consulta y hacer referencia a parámetros como argumentos de su función personalizada.

    Crear función.

Los principales beneficios de crear y usar parámetros son:

  • Vista centralizada de todos sus parámetros a través de la ventana de Administrar Parámetros.

    Ventana Administrar parámetros.

  • Reutilización del parámetro en múltiples pasos o consultas.

  • Hace que la creación de las funciones personalizadas sea sencilla y fácil.

Incluso puede usar parámetros en algunos de los argumentos de los conectores de datos. Por ejemplo, puede crear un parámetro para el nombre del servidor al conectarse a la base de datos del Servidor SQL. Luego, puede usar ese parámetro dentro del cuadro de diálogo de la base de datos del Servidor SQL.

Cuadro de diálogo de base de datos de SQL Server con el parámetro para el nombre del servidor.

Si cambia la ubicación de su servidor, todo lo que tiene que hacer es actualizar el parámetro para el nombre de su servidor y sus consultas se actualizarán.

Nota:

Para obtener mayor información acerca de la creación y el uso de parámetros, vaya hasta el Uso de parámetros.

Crear funciones reutilizables

Si se encuentra en una situación en la que tiene que aplicar el mismo conjunto de transformaciones a diferentes consultas o valores, crear una función personalizada de Power Query que se pueda reutilizar tantas veces como necesite podría ser beneficioso. Una función personalizada de Power Query es una asignación de un conjunto de valores de entrada hasta un único valor de salida, y se crea a partir de M funciones y operadores nativos.

Por ejemplo, supongamos que tiene varias consultas o valores que requieren del mismo conjunto de transformaciones. Podría crear una función personalizada que luego podría invocarse contra las consultas o valores de su elección. Esta función personalizada le ahorraría tiempo y le ayudaría a administrar su conjunto de transformaciones en una ubicación central, que puede modificar en cualquier momento.

Las funciones personalizadas de Power Query se pueden crear a partir de las consultas y parámetros existentes. Por ejemplo, imagine una consulta que tiene varios códigos como una cadena de texto y que desea crear una función que decodifique esos valores.

Lista de códigos.

Se empieza por tener un parámetro que tenga un valor que sirva de ejemplo.

Valor de código de parámetro de ejemplo.

A partir de ese parámetro, crea una nueva consulta donde aplica las transformaciones que necesita. Para este caso, debe dividir el código PTY-CM1090-LAX en múltiples componentes:

  • Origen = PTY
  • Destino = LAX
  • Aerolínea = CM
  • Identificación de vuelo = 1090

Consulta de transformación de ejemplo.

A continuación, puede transformar esa consulta en una función haciendo clic con el botón derecho en la consulta y seleccionando Crear Función. Finalmente, puede invocar su función personalizada en cualquiera de sus consultas o valores, como se muestra en la siguiente imagen.

Invocando una función personalizada.

Después de algunas transformaciones más, puede ver que ha alcanzado el resultado deseado y ha aprovechado la lógica para dicha transformación desde una función personalizada.

Consulta de salida final después de invocar una función personalizada.

Nota:

Para obtener mayor información acerca de cómo crear y usar funciones personalizadas en Power Query, consulte el artículo Funciones Personalizadas.