Compartir por


La directiva de limitación de Fabric

La limitación se produce cuando las operaciones consumen más segundos de unidades de proceso (CUs) que la SKU de capacidad permite. Una limitación excesiva puede dar lugar a una experiencia de usuario final degradada. Un inquilino de Microsoft Fabric puede crear varias capacidades y asignar áreas de trabajo a una capacidad específica para la facturación y el dimensionamiento.

La limitación se aplica en el nivel de capacidad, lo que significa que, mientras que una capacidad o un conjunto de áreas de trabajo puedan experimentar un rendimiento reducido debido a la sobrecarga, otras capacidades pueden continuar ejecutándose con normalidad. Cuando características como los artefactos de OneLake se producen en una capacidad y se consumen en otra, el estado de limitación de la capacidad de consumo determina si se limitan las llamadas al artefacto.

Equilibrio entre rendimiento y confiabilidad

Fabric está diseñado para ofrecer un rendimiento rápido a sus clientes. Las tareas que pueden tardar varios minutos en completarse en otras plataformas pueden finalizar en cuestión de segundos en Fabric. Las operaciones grandes se pueden ejecutar en cualquier momento del día sin necesidad de programar cuidadosamente porque el proceso de esas operaciones se distribuye durante un período de tiempo más largo, sin ralentizar la operación. Fabric lo permite gracias a las funciones integradas de expansión y alisado. Permiten que las capacidades sean autoadministradoras y de recuperación automática cuando los picos temporales de uso provocarían que otros sistemas fallan o se ralentizan.

Creación de ráfagas

Para garantizar un rendimiento rápido, Fabric usa la expansión para permitir que las operaciones se ejecuten lo más rápido posible. La expansión permite que las operaciones usen temporalmente más proceso que el proceso aprovisionado para la SKU de capacidad. Debido a la expansión, los usuarios obtienen resultados rápidamente sin esperar. La expansión también permite una capacidad más pequeña para ejecutar operaciones más grandes que normalmente requerirían una capacidad más costosa.

Suavizado

Para evitar que los usuarios se vean penalizados cuando las operaciones se benefician de ráfagas, Fabric suaviza, o promedia, el uso de CU de una operación a lo largo de un periodo de tiempo más largo. Este comportamiento garantiza que los usuarios puedan disfrutar de un rendimiento constantemente rápido sin experimentar limitaciones.

Suavizado distribuye el uso de CU consumido a través de puntos de tiempo futuros. Los puntos de tiempo de Fabric tienen 30 segundos de duración. Hay 2880 puntos de tiempo en las próximas 24 horas. Fabric administra automáticamente la cantidad de CPU de consumo en cada punto de tiempo.

El tipo de uso de una operación determina el número de puntos de tiempo usados para suavizar. Obtenga información sobre las operaciones de Fabric.

  • Las operaciones interactivas se suavizan durante un mínimo de cinco minutos y hasta 64 minutos en función del uso de CU que consumen.
  • Las operaciones en segundo plano se suavizan durante un período de 24 horas porque normalmente tienen tiempos de ejecución largos y un gran consumo de CU.

Debido al suavizado, solo se aplica una parte del uso de CU para una operación a cualquier punto de tiempo individual, lo que reduce la limitación general. El uso de CU suavizado se acumula a medida que se ejecutan las operaciones. El uso suavizado se paga por la capacidad futura, que es las CU disponibles en puntos de tiempo futuros, ya que la capacidad se ejecuta continuamente.

La expansión y el suavizado funcionan juntos para facilitar la capacidad de los usuarios a realizar su trabajo. Por ejemplo, los usuarios suelen dedicar tiempo a programar trabajos y distribuirlos a lo largo del día. Con el suavizado, el costo de proceso de los trabajos en segundo plano se suaviza durante 24 horas. Esto significa que todos los trabajos programados pueden ejecutarse simultáneamente sin provocar picos que, de otro modo, bloquearían el inicio de los trabajos. Al mismo tiempo, los usuarios pueden disfrutar de un rendimiento rápido y constante sin tener que esperar a que se completen los trabajos lentos ni perder tiempo gestionando la programación de los trabajos.

Nota:

La expansión y el suavizado no se admiten cuando un administrador de capacidad ha habilitado la facturación de escalabilidad automática para Spark. En este escenario, el uso de Spark funciona en un método de pago por usoYou-Go y los conceptos de bursting y suavizado no se aplican.

Desencadenadores y fases de limitación

Aunque las capacidades tienen un suavizado integrado que reduce el impacto de los picos de uso, todavía es posible sobrecargar una capacidad mediante la ejecución de demasiadas operaciones.

La capacidad limita automáticamente las nuevas operaciones cuando se sobrecarga. La limitación se produce en pasos progresivos para minimizar el impacto en tareas importantes, como las actualizaciones de datos.

Incluso cuando una capacidad funciona por encima del 100 % de uso, Fabric no aplica inmediatamente la limitación. En su lugar, la capacidad proporciona protección contra el uso por encima del límite que permite consumir 10 minutos de capacidad futura sin limitación. Este comportamiento ofrece una protección integrada limitada frente a los aumentos, al tiempo que proporciona a los usuarios un rendimiento constantemente rápido sin interrupciones.

La limitación se inicia cuando una capacidad usa todos sus recursos de CU durante los próximos 10 minutos. La primera fase de limitación se aplica 20 segundos de retraso a nuevas operaciones interactivas. La segunda fase de limitación rechaza nuevas operaciones interactivas cuando una capacidad usa todos sus recursos de CU durante la próxima hora. Durante esta fase, las operaciones en segundo plano pueden iniciarse y ejecutarse. La tercera fase de limitación rechaza todas las solicitudes nuevas, interactivas y en segundo plano, cuando la capacidad usa todos sus recursos de CU disponibles durante las próximas 24 horas. La capacidad continúa limitando las solicitudes hasta que se pague la CU consumida.

Nota:

Microsoft intenta mejorar la flexibilidad del cliente en el uso del servicio, a la vez que equilibra la necesidad de administrar el uso de la capacidad del cliente. Por este motivo, Microsoft puede cambiar o actualizar la directiva de limitación de Fabric.

En la tabla se resumen los desencadenadores y las fases de limitación.

Uso Límites de directiva Impacto en la experiencia de directiva de plataforma
Uso <= 10 minutos Protección contra uso por encima del límite Los trabajos pueden consumir 10 minutos de uso de capacidad futura sin limitación.
10 minutos < Uso <= 60 minutos Retraso interactivo Los trabajos interactivos solicitados por el usuario se retrasan 20 segundos al enviarse.
60 minutos < Uso <= 24 minutos Rechazo interactivo Los trabajos interactivos solicitados por el usuario se rechazan.
Uso > 24 horas Rechazo en segundo plano Todas las solicitudes se rechazan.

Ejemplo de límites y suavizado

Este es un ejemplo ilustrativo de cómo funciona el suavizado de una operación en segundo plano que consumió 1 CUHr (su uso equivale a 1 CU durante 1 hora). Las operaciones en segundo plano se realizan de manera fluida durante las 24 horas. La contribución de una operación en segundo plano en cualquier punto de tiempo es # CUHrs para la operación / número de CUHrs en el nivel de SKU. Para un F2, este trabajo contribuiría a 1 CUHr / 48CUhrs = ~2,1 % a cada punto de tiempo. El impacto en los límites de limitación de 10 minutos y 60 minutos es de aproximadamente 2,1 %.

Aquí está el detalle que apoya el ejemplo.

1 CUHr = 3600 RU (1 CU * 60 minutos por hora * 60 segundos por minuto)

Cada punto de tiempo es de 30 segundos. En 24 horas, hay 2880 puntos de tiempo (24 horas * 60 minutos * 2 puntos de tiempo por minuto).

Dado que las 3600 CU se suavizan durante 24 horas, el trabajo contribuye a 3600 CU/2880 puntos de tiempo a cada punto de tiempo de 30 segundos. Por lo tanto, contribuye a 1,25 RU por punto de tiempo.

El porcentaje de limitación de 10 minutos se basa en el total de UNIDADES disponibles en los próximos 10 minutos de tiempo de actividad de capacidad.

Una capacidad F2 tiene 2 CU por segundo (o 2 CU). En cada punto de tiempo, un F2 tiene 2 CUs * 30 segundos = 60 CUs de cómputo.

La contribución del trabajo en segundo plano a cualquier punto de tiempo individual es de 1,25 CU/60 CU = ~2,1 % de un punto de tiempo individual.

En 10 minutos, el F2 tiene 2 UC * 60 segundos * 10 minutos = 1 200 UC de cómputo.

La parte del trabajo en segundo plano que se suaviza en los próximos 10 minutos de capacidad es de 1,25 CU * 2 puntos de tiempo por minuto * 10 minutos = 25 CU.

Por lo tanto, el porcentaje de limitación de 10 minutos es de 25 CU / 1200 CU = ~2,1 %.

Del mismo modo, el impacto porcentual de limitación de 60 minutos del trabajo en segundo plano también es de ~2,1%.

Aunque la operación en segundo plano consumió más RU de las disponibles en el intervalo de tiempo de 10 minutos siguiente (consumió seis veces la cantidad), la capacidad F2 no se limita porque el total de UNIDADES de proceso se suavizan durante 24 horas. Debido al suavizado, solo se aplica una pequeña parte de las UNIDADES de proceso consumidas a cualquier punto de tiempo individual.

Sobrepagos, transporte y agotamiento

Cuando las operaciones usan más capacidad que la SKU admite en un único punto de tiempo, se calcula un uso por encima del límite . Los excesos se calculan después de aplicar el proceso de suavizado. Si hay sobrepagos que superan la ventana de limitación de 10 minutos permitida, se convierten en CUs de transporte .

La protección por uso por encima del límitegarantiza que la capacidad no se reduzca hasta que se complete la ventana de limitación de 10 minutos. Está diseñado para reducir la frecuencia de retrasos interactivos debido a picos temporales de uso.

Las CU de transporte se aplican a cada punto de tiempo posterior. Si un punto de tiempo no está lleno, las CU sin usar reducen la cantidad de CU de transporte. La reducción se conoce como quema.

La aplicación de la limitación continúa hasta que la capacidad sin usar paga todas las CU de transporte.

Capacidades de supervisión para la limitación

Los administradores de capacidad pueden configurar alertas de correo electrónico para recibir notificaciones cuando una capacidad consume el 100 % de sus recursos CU aprovisionados. Los administradores también pueden usar la aplicación de métricas de capacidad para revisar los niveles de restricción de su capacidad.

Dimensionamiento adecuado y optimización de una capacidad

Los niveles de limitación constantemente altos indican la necesidad de equilibrar la carga entre varias capacidades o aumentar el tamaño de la SKU de la capacidad. Al usar SKU de F, puede aumentar y reducir manualmente el tamaño de la SKU en cualquier momento en la configuración de administración, lo que le permite resolver la limitación cuando sea necesario.

Cómo indicar que se está produciendo una limitación de capacidad

Cuando una capacidad rechaza las solicitudes, los usuarios ven códigos de error específicos y texto de error:

  1. Código de estado CapacityLimitExceeded
  2. Mensaje de error Your organization's Fabric compute capacity has excceded its limits. Try again later.
  3. Mensaje de error Cannot load model due to reaching capacity limits

Nota:

El rendimiento lento a menudo se debe al diseño de un artículo. Solo a veces el rendimiento es lento debido a la limitación de capacidad.

Cuando se sobrecarga una capacidad, un administrador de capacidad puede usar la aplicación de métricas de capacidad de Fabric para confirmar la limitación.

  1. La tabla Eventos del sistema de la página Cómputo muestra el historial de eventos de regulación.
  2. Los gráficos de limitación de la página Proceso se muestran cuando el uso suavizado supera uno de los límites.

Cómo detener la limitación cuando se produce

Las capacidades son auto-reparables, por lo que siempre puede esperar hasta que termine el estado de sobrecarga antes de enviar nuevas solicitudes.

Sin embargo, para detener la limitación más rápido, puede usar las estrategias que se enumeran a continuación.

Al usar capacidades de SKU de F, para detener la limitación:

  • Aumente temporalmente la SKU. Al aumentar la SKU, se agota el transporte más rápido, ya que cada punto de tiempo tiene más capacidad de inactividad.
  • Pausa y luego reanuda tu capacidad. La pausa de una capacidad da como resultado un evento de facturación para el uso acumulado de la capacidad futura. Cuando se inicia o reanuda una capacidad, tiene un uso de capacidad futuro cero para que pueda aceptar nuevas operaciones inmediatamente.

Al usar capacidades de SKU de P, para detener la limitación:

Las operaciones en curso no se limitan

La limitación solo afecta a las operaciones solicitadas después de que la capacidad inicie la limitación. Todas las operaciones, incluidas las de larga duración enviadas antes de que se iniciara la limitación, pueden ejecutarse hasta completarse. Este comportamiento garantiza que las operaciones se completen, incluso durante los aumentos de uso de la CU.

Protección de limitación compuesta

En Fabric, una operación suele desencadenar otros elementos o cargas de trabajo para completarse. Hay muchos ejemplos, pero uno típico es ver un informe. Cada objeto visual del informe ejecuta una consulta en un modelo semántico subyacente. El modelo semántico también puede leer datos de OneLake para proporcionar el resultado de la consulta. Cada una de estas solicitudes forma una cadena.

Cuando hay una cadena de llamadas, hay un riesgo de limitación compuesta, que es cuando la limitación se aplica más de una vez a la misma solicitud. Fabric tiene una protección integrada de limitación compuesta que reduce la probabilidad de que se produzca una limitación compuesta. Las cargas de trabajo pueden optar por usar esta protección.

Cuando las cargas de trabajo admiten la protección de limitación compuesta, una solicitud solo se limita una vez para cada capacidad que participa en la cadena. La decisión de limitación se produce cuando la solicitud se inicia y se aplica a todas las operaciones de la cadena.

Si una cadena se basa en más de una capacidad, cada capacidad aplica la limitación una vez para la primera solicitud que recibe en la cadena.

Las siguientes experiencias de carga de trabajo admiten la limitación compuesta:

  • Modelos semánticos que se conectan a otros modelos semánticos mediante Direct Query.
  • Consultas DAX desde informes paginados a modelos semánticos.

El comportamiento de limitación es específico de las cargas de trabajo de Fabric

Aunque la mayoría de los productos de Fabric siguen las reglas de limitación mencionadas antes, hay algunas excepciones.

Por ejemplo, los flujos de eventos de Fabric tienen muchas operaciones que se pueden ejecutar durante años una vez que se han iniciado. La limitación de nuevas operaciones de flujo de eventos no tendría sentido, por lo que, en su lugar, la cantidad de recursos de CU asignados para mantener abierto el flujo se reduce hasta que la capacidad vuelva a estar en buen estado.

Otra excepción es la inteligencia en tiempo real, que no sería en tiempo real si las operaciones se retrasaran 20 segundos. Como resultado, la inteligencia en tiempo real no aplica la primera fase de limitación con retrasos de 20 segundos a 10 minutos de capacidad futura. La inteligencia en tiempo real espera hasta la fase de rechazo en 60 minutos de capacidad futura para comenzar la limitación. Este comportamiento garantiza que los usuarios puedan seguir disfrutando del rendimiento en tiempo real incluso durante períodos de alta demanda.

De la misma forma, casi todas las operaciones de la categoría Almacenamiento se notifican como en segundo plano para aprovechar el suavizado de la actividad de 24 horas para permitir los patrones de uso más flexibles. La clasificación de todo el almacenamiento de datos como en segundo plano impide que los picos de uso de CU desencadenen la limitación con demasiada rapidez. Algunas solicitudes pueden desencadenar una cadena de operaciones reguladas de manera distinta. Cuando una operación interactiva inicia una cadena que incluye una operación en segundo plano, la operación en segundo plano puede estar sujeta a limitaciones como una operación interactiva.

Clasificaciones interactivas y en segundo plano para la limitación y el suavizado

Algunos administradores pueden observar que las operaciones a veces se clasifican como interactivas y suavizadas como en segundo plano, o viceversa. Esta distinción se produce porque los sistemas de limitación de Fabric deben aplicar reglas de limitación antes de que una solicitud comience a ejecutarse.

El sistema de limitación intenta clasificar con precisión las operaciones tras el envío. A veces, cuando una operación comienza a ejecutarse, hay información más detallada disponible que cambia la categorización. En escenarios ambiguos, el sistema de limitación vuelve a clasificar las operaciones como segundo plano, que es el mejor interés del usuario.

Realizar un seguimiento de los usos por encima del límite y las operaciones rechazadas

Para ver si la capacidad está sobrecargada, revise el gráfico Uso de la aplicación Métricas de capacidad de Microsoft Fabric. Un pico que pasa por la línea indica un uso por encima del límite. Para investigar aún más el uso por encima del límite, explore en profundidad la página del punto de tiempo. Después, puede revisar las operaciones interactivas y en segundo plano, y ver cuáles eran responsables de los usos por encima del límite.

Dado que el uso que supera el 100 % no significa automáticamente la limitación, debes usar el gráfico de limitación al evaluar el uso por encima del límite. Desde allí puedes abrir una tabla que muestre los minutos para evolucionar, un gráfico con agregar, evolución y porcentaje acumulado, etc. Minutos para quemar estima cuánto tiempo tardaría el agotamiento si no se producen más operaciones en la capacidad.

Animación en la que se muestra la opción de obtención de detalles para un momento dado seleccionado.

Para ver un historial visual de cualquier sobreutilización de la capacidad, incluida la carga, la acumulación y el agotamiento de los datos de uso, ve a la pestaña Uso por encima del límite. Puedes cambiar la escala visual de uso por encima del límite para mostrar 10 minutos, 60 minutos y 24 horas.

Animación en la que se muestra el uso por encima del límite a lo largo del tiempo.

La exploración en profundidad de la aplicación Métricas de capacidad de Microsoft Fabric permite a los administradores ver las operaciones que se han rechazado durante un evento de limitación. Hay información limitada sobre estas operaciones, ya que nunca se ha permitido que se iniciaran. El administrador puede ver el producto, el usuario, el identificador de la operación y la hora a la que se ha enviado la solicitud. Cuando se rechaza una solicitud, los usuarios finales reciben un mensaje de error cuando se rechaza una solicitud que les pide que vuelvan a intentarlo más tarde.

Proceso facturable y no facturable

Al revisar el uso de la capacidad en la aplicación de métricas de capacidad, algunas operaciones son facturables y otras no son facturables. Solo las operaciones facturables se incluyen en los cálculos de limitación. Las funcionalidades de versión preliminar pueden generar operaciones no facturables. Use operaciones no facturables para planear con anticipación para que la capacidad se ajuste correctamente cuando estas características en vista previa se puedan facturar.