Características prémium de flujos de datos

Los flujos de datos están admitidos para usuarios de Power BI Pro, Premium por usuario (PPU) y Power BI Premium. Algunas características solo están disponibles con una suscripción de Power BI Premium, que es una capacidad Premium o una licencia Premium por usuario (PPU). En este artículo se describen en detalle las características exclusivas de Premium y Premium por usuario (PPU), así como sus usos.

Las características siguientes solo están disponibles con Power BI Premium (suscripción de capacidad Premium o PPU):

  • Motor de proceso mejorado
  • DirectQuery.
  • Entidades calculadas
  • Entidades vinculadas
  • Actualización incremental

En las secciones siguientes se describe detalladamente cada una de estas características.

Motor de proceso mejorado

El motor de proceso mejorado de Power BI permite a los suscriptores de Power BI Premium usar su capacidad para optimizar el uso de flujos de datos. El uso del motor de proceso mejorado proporciona las siguientes ventajas:

  • Reducción drástica del tiempo de actualización necesario para los pasos ETL de ejecución prolongada en entidades calculadas, como la realización de combinaciones, distinciones, filtrados y agrupaciones
  • Realiza consultas DirectQuery sobre entidades

Nota

  • Los procesos de validación y actualización informan sobre los flujos de datos del esquema de modelo. Para configurar el esquema de las tablas, use el Editor de Power Query y establezca los tipos de datos.
  • Esta característica está disponible en todos clústeres de Power BI excepto WABI-INDIA-CENTRAL-A-PRIMARY

Habilitación del motor de proceso mejorado

Importante

El motor de proceso mejorado solo funciona para las capacidades A3 o superiores de Power BI.

En Premium Gen2, el motor de proceso mejorado se establece individualmente para cada flujo de datos. Hay tres configuraciones para elegir:

  • Deshabilitada

  • Optimizada (valor predeterminado): el motor de proceso mejorado está apagado. Se activa automáticamente cuando otra tabla del flujo de datos hace referencia a una tabla o cuando los flujos de datos están conectados a otro flujo de datos de la misma área de trabajo.

  • Activado

Si quiere cambiar la configuración predeterminada y habilitar el motor de proceso mejorado, haga lo siguiente:

  1. En el área de trabajo, junto al flujo de datos para el que quiere cambiar la configuración, seleccione Más opciones.

  2. En el menú Más opciones del flujo de datos, seleccione Configuración.

    Captura de pantalla del menú Más opciones de un flujo de datos con la opción de configuración resaltada.

  3. Expanda la configuración de motor de proceso mejorado.

    Captura de pantalla de la página de configuración de un flujo de datos con la opción de configuración de motor de proceso mejorado resaltada.

  4. En la configuración del motor de proceso mejorado, seleccione Activado y, luego, Aplicar.

    Captura de pantalla de la configuración de motor de proceso mejorado con la selección activada y el botón Activar resaltado.

Uso del motor de proceso mejorado

Una vez que active el motor de proceso mejorado, vuelva a los flujos de datos. Debería ver una mejora del rendimiento en cualquier tabla calculada que realice operaciones complejas, como combinaciones u operaciones de agrupar por para flujos de datos creados a partir de tablas vinculadas existentes en la misma capacidad.

Para hacer el mejor uso del motor de proceso, divida la etapa ETL en dos flujos de datos independientes de la siguiente manera:

  • Flujo de datos 1: este flujo de datos solo debe ingerir todo lo necesario desde un origen de datos.
  • Flujo de datos 2: realice todas las operaciones ETL en este segundo flujo de datos, pero asegúrese de que hace referencia al flujo de datos 1, que debe estar en la misma capacidad. Asegúrese también de realizar primero las operaciones que se puedan plegar (filtrar, agrupar por, distinguir, combinar), antes que cualquier otra, para garantizar que se use el motor de proceso.

Preguntas y respuestas frecuentes

Pregunta: He habilitado el motor de proceso mejorado, pero las actualizaciones son más lentas. ¿Por qué?

Respuesta: Si habilita el motor de proceso mejorado, hay dos posibles explicaciones para los tiempos de actualización más lentos:

  • Cuando el motor de proceso mejorado está habilitado, requiere algo de memoria para que funcione correctamente. Por lo tanto, se reduce la memoria disponible para realizar una actualización, lo que aumenta la probabilidad de que las actualizaciones se puedan poner en cola, lo que a su vez reduce el número de flujos de datos que se pueden actualizar simultáneamente. Para solucionarlo, al habilitar el proceso mejorado, aumente la memoria asignada a los flujos de datos para asegurarse de que la memoria disponible para las actualizaciones de flujo de datos simultáneas siga siendo la misma.

  • Otro motivo por el que las actualizaciones pueden volverse más lentas es que el motor de proceso solo funciona sobre entidades existentes. Si el flujo de datos hace referencia a un origen de datos que no es un flujo de datos, no verá ninguna mejora. No se producirá un aumento del rendimiento, ya que, en algunos escenarios de macrodatos, la lectura inicial de un origen de datos sería más lenta porque los datos deben pasarse al motor de proceso mejorado.

Pregunta: No veo la alternancia del motor de proceso mejorado. ¿Por qué?

Respuesta: el motor de proceso mejorado se está publicando por fases en regiones de todo el mundo, pero aún no está disponible en todas las regiones.

Pregunta: ¿Cuáles son los tipos de datos admitidos en el motor de proceso?

Respuesta: El motor de proceso mejorado y los flujos de datos actualmente admiten los siguientes tipos de datos. Si el flujo de datos no utiliza uno de los siguientes tipos de datos, se produce un error durante la actualización:

  • Fecha y hora
  • Número decimal
  • Texto
  • Número entero
  • Fecha/hora/zona
  • Verdadero/Falso
  • Fecha
  • Hora

Uso de DirectQuery con flujos de datos en Power BI

Puede usar DirectQuery para conectarse directamente a flujos de datos y así conectarse directamente a su flujo de datos sin tener que importar los datos.

El uso de DirectQuery con flujos de datos permite las siguientes mejoras en los procesos de Power BI y flujos de entrada:

  • Evitar programaciones de actualización independientes: DirectQuery se conecta directamente a un flujo de entrada, lo que elimina la necesidad de crear un conjunto de datos importado. Como tal, el uso de DirectQuery con los flujos de datos significa que ya no necesita programaciones de actualización independientes del flujo de datos y el conjunto de datos para asegurarse de que los datos se sincronizan.

  • Filtrar datos: DirectQuery resulta útil para trabajar en una vista filtrada de los datos dentro de un flujo de datos. Si desea filtrar los datos y, por tanto, trabajar con un subconjunto más pequeño de los datos del flujo de datos, puede usar DirectQuery (y el motor de proceso) para filtrar los datos de flujo de datos y trabajar con el subconjunto filtrado que necesite.

Uso de DirectQuery en flujos de datos

El uso de DirectQuery con flujos de datos está disponible en Power BI Desktop.

También hay requisitos previos para usar DirectQuery con flujos de datos:

  • El flujo de datos debe residir en un área de trabajo habilitada para Power BI Premium
  • El motor de proceso debe estar activado.

Puede obtener más información sobre DirectQuery con los flujos de datos en el artículo Uso de DirectQuery con flujos de datos.

Habilitación de DirectQuery para flujos de datos

Para asegurarse de que el flujo de datos está disponible para el acceso de DirectQuery, el motor de proceso mejorado debe estar en su estado optimizado. Para habilitar DirectQuery para flujos de datos, establezca la nueva opción Configuración mejorada del motor de proceso en Activada. La siguiente imagen muestra la opción seleccionada correctamente.

Control granular para la consulta directa

Cuando haya aplicado esa opción, actualice el flujo de datos para que la optimización surta efecto.

Consideraciones y limitaciones relativas a DirectQuery

Existen algunas limitaciones conocidas de DirectQuery y los flujos de datos:

  • Los modelos compuestos o mixtos con orígenes de datos de importación y DirectQuery no se admiten actualmente.

  • Durante la visualización, los flujos de datos de gran tamaño pueden presentar problemas relacionados con incidencias de tiempo de expiración. Los flujos de datos de gran tamaño que presenten problemas relacionados con incidencias de tiempo de expiración deberán usar el modo de importación.

  • En la configuración del origen de datos, el conector de flujo de datos mostrará las credenciales no válidas si usa DirectQuery. Esto no afecta al comportamiento, de modo que el conjunto de datos funcionará correctamente.

Entidades calculadas

Puede realizar cálculos en almacenamiento al usar flujos de datos con una suscripción de Power BI Premium. Esto le permite realizar cálculos en los flujos de datos existente y devolver resultados que le permiten centrarse en la creación y el análisis de informes.

Tabla calculada

Para realizar cálculos en almacenamiento, primero debe crear el flujo de datos e incorporar datos en ese almacenamiento del flujo de datos de Power BI. Una vez que disponga de un flujo de datos que contiene los datos, puede crear entidades calculadas, que son entidades que realizan cálculos en almacenamiento.

Consideraciones y limitaciones relativas a las entidades calculadas

  • Al trabajar con flujos de datos creados en la cuenta de Azure Data Lake Storage Gen 2 de una organización, las entidades vinculadas y las entidades calculadas solo funcionan correctamente cuando residen en la misma cuenta de almacenamiento.

A modo de procedimiento recomendado, para realizar cálculos sobre datos combinados de forma local y datos en la nube, cree un flujo de datos para cada origen (uno para el entorno local y otro para la nube). Después, cree un tercer flujo de datos para combinar o calcular los dos orígenes de datos.

Entidades vinculadas

Puede hacer referencia a flujos de datos existentes al usar una suscripción de Power BI Premium, ya que le permite realizar cálculos en estas entidades mediante entidades calculadas o crear una tabla como "única fuente de confianza" que puede reutilizar en varios flujos de datos.

Actualización incremental

Los flujos de datos se pueden configurar de modo que se actualicen incrementalmente para evitar tener que extraer todos los datos en cada actualización. Para ello, seleccione el flujo de entrada y haga clic en el icono de actualización incremental.

Actualización incremental

Al establecer la actualización incremental, se agregan parámetros al flujo de datos para especificar el intervalo de fechas. Para obtener información detallada sobre cómo configurar la actualización incremental, consulte el artículo sobre la actualización incremental.

Consideraciones sobre cuándo no se debe establecer la actualización incremental

No establezca un flujo de datos para la actualización incremental en las siguientes situaciones:

  • Las entidades vinculadas no deben usar la actualización incremental si hacen referencia a un flujo de datos.

Pasos siguientes

En los artículos siguientes encontrará más información sobre los flujos de datos y Power BI: