Ajuste de tamaño de la puerta de enlace de datos local

Este artículo va dirigido a los administradores de Power BI que necesitan instalar y administrar la puerta de enlace de datos local.

La puerta de enlace es necesaria cuando Power BI debe acceder a los datos que no son accesibles directamente a través de Internet. Se puede instalar en un servidor local o en una infraestructura como servicio (IaaS) hospedada en la máquina virtual.

Cargas de trabajo de puerta de enlace

La puerta de enlace de datos local admite dos cargas de trabajo. Es importante que comprenda primero estas cargas de trabajo antes de pasar a las recomendaciones y el tamaño de la puerta de enlace.

Carga de trabajo de datos en caché

La carga de trabajo de datos en caché recupera y transforma los datos de origen para cargarlos en modelos semánticos (anteriormente conocidos como "conjuntos de datos") de Power BI. Emplea tres pasos:

  1. Conexión: la puerta de enlace se conecta a los datos de origen.
  2. Recuperación y transformación de datos: los datos se recuperan y, cuando es necesario, se transforman. Siempre que sea posible, el motor de mashup de Power Query inserta pasos de transformación en el origen de datos, lo que se conoce como plegado de consultas . Cuando no es posible, las transformaciones deben hacerse mediante la puerta de enlace. En este caso, la puerta de enlace consumirá más recursos de CPU y memoria.
  3. Transferencia: los datos se transfieren al servicio Power BI, se necesita una conexión a Internet confiable y rápida, en especial con grandes volúmenes de datos.

Diagrama de datos en caché en el que se muestra la puerta de enlace de datos local que se conecta a los orígenes locales.

Cargas de trabajo de conexión dinámica y DirectQuery

La carga de trabajo de conexión dinámica y DirectQuery funciona principalmente en modo de paso a través. El servicio Power BI envía consultas y la puerta de enlace responde con los resultados de la consulta. Por lo general, los resultados de la consulta son de pequeño tamaño.

Esta carga de trabajo requiere recursos de CPU para el enrutamiento y los resultados de las consultas. Normalmente, hay mucha menos demanda de CPU de la que precisa la carga de trabajo de datos en caché, en especial cuando es necesaria para transformar los datos para el almacenamiento en caché.

Es importante una conectividad confiable, rápida y coherente para garantizar que los usuarios de informes tengan experiencias que respondan.

Diagrama de Conexión dinámica y DirectQuery en el que se muestra la puerta de enlace de datos local que se conecta a los orígenes locales.

Consideraciones de tamaño

La determinación del tamaño correcto de la máquina de puerta de enlace puede depender de las siguientes variables:

  • En el caso de cargas de trabajo de datos de caché:
    • El número de actualizaciones simultáneas del modelo semántico
    • Los tipos de orígenes de datos (base de datos relacional, base de datos analítica, fuentes de distribución de datos o archivos)
    • El volumen de datos que se van a recuperar de los orígenes de datos
    • Las transformaciones que debe realizar el motor de mashup de Power Query
    • El volumen de datos que se va a transferir al servicio Power BI
  • En el caso de las cargas de trabajo de conexión dinámica y DirectQuery:
    • El número de usuarios simultáneos del informe
    • El número de objetos visuales en las páginas del informe (cada uno de ellos envía al menos una consulta)
    • La frecuencia de las actualizaciones de la caché de consultas del panel de Power BI
    • El número de informes en tiempo real mediante la característica Actualización automática de páginas
    • Si los modelos semánticos aplican Seguridad de nivel de fila (RLS)

Por lo general, las cargas de trabajo de conexión dinámica y DirectQuery requieren una CPU suficiente, mientras que las cargas de trabajo de datos de caché requieren más CPU y memoria. Ambas cargas de trabajo dependen de una buena conectividad con el servicio Power BI y los orígenes de datos.

Nota

Las capacidades de Power BI imponen límites sobre el paralelismo de las actualizaciones de los modelos y sobre el rendimiento de la conexión dinámica y DirectQuery. No tiene sentido ajustar el tamaño de las puertas de enlace para que proporcionen más capacidad de la que admite el servicio Power BI. Los límites difieren en la SKU Premium (y en la SKU A de tamaño equivalente). Para más información, consulte ¿Qué es Power BI Premium? (Nodos de capacidad).

Recomendaciones

Las recomendaciones de tamaño de la puerta de enlace dependen de muchas variables. En esta sección, se proporcionan recomendaciones generales que puede tener en cuenta.

Tamaño inicial

Puede ser difícil calcular con precisión el tamaño correcto. Se recomienda comenzar con una máquina con al menos 8 núcleos de CPU, 8 GB de RAM y varios adaptadores de red Gigabit. Después, puede medir una carga de trabajo típica de puerta de enlace mediante el registro de los contadores del sistema de memoria y CPU. Para más información, consulte Supervisión y optimización del rendimiento de la puerta de enlace de datos local.

Conectividad

Planee la mejor conectividad posible entre el servicio Power BI y la puerta de enlace y entre la puerta de enlace y los orígenes de datos.

  • Busque confiabilidad, velocidad rápida y latencias sistemáticamente bajas.
  • Elimine (o reduzca) los saltos de máquina entre la puerta de enlace y los orígenes de datos.
  • Quite todas las limitaciones de red impuestas por la capa de proxy del firewall. Para más información sobre los puntos de conexión de Power BI, consulte Incorporación de direcciones URL de Power BI a la lista de permitidos.
  • Configure Azure ExpressRoute para establecer conexiones privadas y administradas a Power BI.
  • En el caso de los orígenes de datos de máquinas virtuales de Azure, asegúrese de que las máquinas virtuales estén colocadas con el servicio Power BI.
  • En el caso de cargas de trabajo de conexión dinámica a SQL Server Analysis Services (SSAS) que supongan RLS dinámico, asegúrese de que la conectividad entre la máquina de puerta de enlace y Active Directory local sea correcta.

Agrupación en clústeres

En el caso de implementaciones a gran escala, puede crear una puerta de enlace con varios miembros de clúster. Los clústeres evitan puntos únicos de error y pueden equilibrar la carga del tráfico entre puertas de enlace. Puede:

  • Instale una o varias puertas de enlace en un clúster.
  • Aísle las cargas de trabajo en puertas de enlace independientes o clústeres de servidores de puerta de enlace.

Para más información, consulte Administración de clústeres de alta disponibilidad y equilibrio de carga de la puerta de enlace de datos local.

Configuración y diseño del modelo semántico

El diseño del modelo semántico y su configuración pueden afectar a las cargas de trabajo de puerta de enlace. Para reducir la carga de trabajo de puerta de enlace, puede considerar las siguientes acciones.

Para importar modelos semánticos:

  • Configure la actualización de datos menos frecuente.
  • Configure la actualización incremental para reducir la cantidad de datos que se van a transferir.
  • Siempre que sea posible, asegúrese de que tiene lugar el plegado de consultas.
  • En especial, en el caso de grandes volúmenes de datos o que haya una necesidad de resultados de baja latencia, convierta el diseño a un modelo DirectQuery o compuesto.

Para los modelos semánticos de DirectQuery:

  • Optimice los diseños de orígenes de datos, modelos e informes. Para más información, consulte Instrucciones del modelo de DirectQuery en Power BI Desktop.
  • Cree agregaciones para almacenar en caché los resultados de nivel superior con el fin de reducir el número de solicitudes de DirectQuery.
  • Restrinja los intervalos de actualización automática de páginas en diseños de informe y configuraciones de capacidad.
  • En especial, cuando se aplique RLS dinámico, restrinja la frecuencia de actualización de la caché de paneles.
  • En especial, en el caso de volúmenes de datos más pequeños o de datos no volátiles, convierta el diseño en un modelo de importación o compuesto.

Para los modelos semánticos de conexión dinámica:

  • En especial, cuando se aplique RLS dinámico, restrinja la frecuencia de actualización de la caché de paneles.

Para obtener más información sobre este artículo, consulte los recursos siguientes: