Consideraciones y limitaciones de flujos de datos

Existen algunas limitaciones en los flujos de entrada en cuanto a la creación, las actualizaciones y la administración de capacidades que los usuarios deben tener en cuenta, como se describe en las secciones siguientes.

Limitaciones generales

  • Es posible que los flujos de datos no estén disponibles para todos los clientes del DoD de la Administración Pública de Estados Unidos. Se puede encontrar paridad de características en entornos gubernamentales en el artículo Disponibilidad de características de Power BI para la administración pública.
  • Los orígenes de datos eliminados no se quitan de la página del origen de datos de flujo de datos. Este es un comportamiento inofensivo y no afecta a la actualización ni a la edición de flujos de datos. En la vista Linaje , los orígenes de datos eliminados aparecen como linaje para un flujo de datos.
  • Los orígenes de datos eliminados siguen apareciendo en la página de configuración del menú desplegable de la puerta de enlace.
  • La profundidad equivale a los flujos de datos vinculados a otros flujos de datos. La profundidad máxima actual es 32.
  • La amplitud equivale a las entidades dentro de un flujo de datos.
    • No hay ninguna guía o límite en cuanto al número óptimo de entidades en un flujo de datos; sin embargo, los flujos de datos compartidos tienen un límite de actualización de dos horas por entidad y tres por flujo de datos. Por lo tanto, si tiene dos entidades y cada una tarda dos horas, no debe colocarlas en el mismo flujo de datos.
    • En Power BI Premium, las instrucciones y los límites se basan en casos de uso individuales y no en requisitos específicos. El único límite en Power BI Premium es una actualización de 24 horas por flujo de datos.
  • Se requiere una suscripción a Power BI Premium para poder actualizar más de diez flujos de datos en el área de trabajo.
  • Las limitaciones de PowerQuery se encuentran en el artículo Límites de PowerQuery Online.
  • Los flujos de datos de Power BI no admiten el uso de variables globales en un argumento de dirección URL.
  • Actualmente, no se admite Multi-Geo a menos que configure el almacenamiento para que use su propia cuenta de almacenamiento de Azure Data Lake Gen2.
  • La compatibilidad con redes virtuales se consigue mediante una puerta de enlace.
  • Al usar Entidades calculadas con orígenes de datos de puerta de enlace, la ingesta de datos debe realizarse en orígenes de datos diferentes a los de los cálculos. Las entidades calculadas deben basarse en entidades que solo se usan para la ingesta y no en los datos de ingesta de sus propios pasos de combinación.
  • En los flujos de datos de Power BI puede usar parámetros, pero no puede editarlos a menos que edite todo el flujo de datos. En este sentido, los parámetros de los flujos de datos se comportan de manera similar a las constantes declaradas.
  • Algunos conectores encontrados en Solucionar problemas con los escenarios de actualización no se admiten para flujos de datos y datamarts en áreas de trabajo Premium.

Creación de flujos de datos

Cuando cree flujos de datos, tenga en cuenta lo siguiente:

  • La creación de flujos de datos se realiza en el entorno de Power Query Online (PQO); consulte las limitaciones que se describen en Límites de Power Query. Dado que la creación de flujos de datos se realiza en el entorno de Power Query Online (PQO), las actualizaciones realizadas en las configuraciones de la carga de trabajo de flujos de datos solo afectan a las actualizaciones, y no a la experiencia de creación.

  • Los flujos de datos solo pueden modificarlos sus propietarios.

  • Los flujos de datos no están disponibles en Mi área de trabajo.

  • Los flujos de datos que usan orígenes de datos de puerta de enlace no admiten varias credenciales para el mismo origen de datos.

  • Para usar el conector Web.Page se requiere una puerta de enlace.

Consideraciones sobre las API

Se puede encontrar más información sobre las API de REST de flujos de datos en la referencia de la API de REST. Estas son algunos aspectos que se deben tener en cuenta:

  • Al exportar e importar un flujo de datos, ese flujo de datos recibe un nuevo identificador.

  • La importación de flujos de datos que contienen tablas vinculadas no actualizará las referencias existentes en el flujo de datos (estas consultas deben actualizarse manualmente antes de importar el flujo de datos).

  • Al implementar un flujo de datos, puede aprovechar los parámetros GenerateUniqueName y Abort de controladores de conflictos para anular la operación cuando ya exista o indicar a la API que cree automáticamente un nombre único en su lugar. Los flujos de datos se pueden sobrescribir con el parámetro CreateOrOverwrite, si se han creado inicialmente mediante la API de importación.

Flujos de datos en capacidades compartidas

Existen limitaciones para los flujos de datos en las capacidades compartidas (capacidades que no son Premium):

  • Al actualizar los flujos de datos, los tiempos de espera en una capacidad de uso compartido son de dos horas por tabla y de tres horas por flujo de datos.
  • No se pueden crear tablas vinculadas en flujos de datos compartidos, si bien pueden existir en ellos mientras la propiedad Carga habilitada de la consulta esté deshabilitada.
  • No se pueden crear tablas calculadas en flujos de datos compartidos.
  • Los servicios AutoML y Cognitive no están disponibles en los flujos de datos compartidos.
  • La actualización incremental no funciona en los flujos de datos compartidos.

Flujos de datos de la versión Premium

Los flujos de datos que existen en la versión Premium presentan las siguientes consideraciones y limitaciones.

Actualizaciones y consideraciones sobre los datos:

  • Al actualizar los flujos de datos, los tiempos de espera son de 24 horas (no hay distinción entre tablas o flujos de datos).

  • Al cambiar un flujo de datos de una directiva de actualización incremental a una actualización normal, o viceversa, se descartarán todos los datos.

  • Al modificar el esquema de un flujo de datos, se descartarán todos los datos.

  • Cuando se usa una licencia Premium por usuario (PPU) con flujos de datos, los datos se borran al moverlos fuera de un entorno PPU.

  • Cuando un flujo de datos se actualiza en un contexto Premium por usuario (PPU), los datos no son visibles para los usuarios que no son PPU.

  • La actualización incremental solo funciona con flujos de datos cuando el motor de proceso mejorado está habilitado.

Tablas vinculadas y calculadas:

  • Las tablas vinculadas pueden descender hasta una profundidad de 32 referencias.

  • No se permiten dependencias cíclicas de tablas vinculadas.

  • Una tabla vinculada no se puede combinar con una tabla estándar que obtenga sus datos de un origen de datos local.

  • Cuando se usa una consulta (consulta A, por ejemplo) en el cálculo de otra (consulta B) en los flujos de datos, la consulta B se convierte en una tabla calculada. Las tablas calculadas no pueden hacer referencia a orígenes locales.

Motor de proceso:

  • al usar el motor de proceso, existe un aumento inicial aproximado del 10 % al 20 % en el tiempo de ingesta de datos.

    • Este aumento solo se aplica al primer flujo de datos que se encuentra en el motor de proceso y lee los datos del origen de datos.
    • Los flujos de datos subsiguientes que usan el flujo de datos de origen no sufren la misma penalización.
  • Solo determinadas operaciones hacen uso del motor de proceso y solo cuando se utiliza mediante una tabla vinculada o como tabla calculada. Puede encontrar una lista completa de las operaciones disponibles en esta entrada de blog.

Administración de la capacidad:

  • por diseño, las capacidades de Power BI Premium tienen un administrador de recursos interno que limita las cargas de trabajo de distintas formas cuando la capacidad se ejecuta con memoria insuficiente.

    1. En el caso de los flujos de datos, esta presión limitante reduce el número de contenedores M disponibles.
    2. La memoria de los flujos de datos se puede establecer en 100 % con un contenedor de tamaño adecuado para los tamaños de datos, y la carga de trabajo administrará el número de contenedores de forma adecuada.
  • El número aproximado de contenedores se puede calcular al dividir la memoria total asignada a la carga de trabajo entre la cantidad de memoria asignada a un contenedor.

Uso del flujo de datos en modelos semánticos

  • Al crear un modelo semántico en Power BI Desktop y luego publicarlo en el servicio Power BI, asegúrese de que las credenciales utilizadas en Power BI Desktop para la fuente de datos de los flujos de datos son las mismas credenciales utilizadas cuando el modelo semántico se publica en el servicio.
    1. Si no se garantiza que las credenciales son las mismas, se produce un error de clave no encontrada al actualizar el modelo semántico

Nota:

Si se cambia la estructura del flujo de datos, como una columna nueva o a la que se le ha cambiado el nombre, el modelo semántico no mostrará el cambio, y el cambio también puede hacer que falle la actualización de datos en el servicio Power BI para el modelo semántico, hasta que se actualice en Power BI Desktop y se vuelva a publicar.

Flujos de datos y conexiones con nombre

Al usar flujos de datos con conexiones con nombre, se aplican las limitaciones siguientes:

  • Solo puede crear una conexión en la nube de una ruta y un tipo concretos; por ejemplo, solo podría crear una conexión en la nube de SQL más un servidor o una base de datos. Puede crear varias conexiones de puerta de enlace.
  • No se pueden asignar nombres ni cambiar el nombre de los orígenes de datos en la nube; puede asignar un nombre o cambiar el nombre de las conexiones de puerta de enlace.

Limitaciones de ADLS

  • ADLS no está disponible en los entornos GCC, GCC High o DOD. Para obtener más información, consulte Power BI para clientes de la Administración Pública de Estados Unidos.
  • Debido a los cambios en las API de ADLS Gen 2, debe estar asignado como propietario del recurso.
  • No se admite la migración de suscripciones de Azure, pero hay dos alternativas para ello:
    • Primer enfoque: después de la migración, el usuario puede desasociar las áreas de trabajo y volver a asociarlas. Si usa la cuenta de nivel de inquilino, debe desasociar todas las áreas de trabajo y luego desasociarlas en el nivel de inquilino y volver a asociarlas. Puede que esta opción no sea conveniente para los clientes que no quieran eliminar todos sus flujos de datos o que tengan muchas áreas de trabajo.
    • Segundo enfoque: si el enfoque anterior no es factible, envíe una solicitud de soporte técnico para cambiar el identificador de suscripción de la base de datos.
  • ADLS no es compatible con la mayoría de los elementos de la lista de la sección Nombres de directorios y archivos del artículo sobre la nomenclatura de áreas de trabajo y flujos de datos, debido a las siguientes limitaciones:
    • Power BI devuelve un error que no resulta de utilidad, o permite que continúe el proceso; sin embargo, se producirá un error en la actualización.
  • No se admiten suscripciones de ADLS entre inquilinos. El ADLS asociado a Power BI debe formar parte del mismo inquilino de Azure que usa Power BI para Microsoft Entra ID.

Tipos de datos de flujo de datos

Los tipos de datos admitidos en los flujos de datos son los siguientes:

Tipo de datos de mashup Tipo de datos de flujo de datos
Time Time
Date Date
DateTime DateTime
Fecha, hora y zona horaria DateTimeOffset
Lógicos Booleano
Texto String
Any Cadena
Moneda Decimal
Int8 Int64
Int16 Int64
Int32 Int64
Int64 Int64
Double Double
Porcentaje Doble
Single Double
Decimal Double
Number Double
Duration No compatible
Binary No compatible
Función No compatible
Tabla No compatible
List No compatible
Registro No compatible
Tipo No compatible
Acción No compatible
Ninguno No compatible
Null No compatible

En los artículos siguientes encontrará más información sobre los flujos de datos y Power BI: