Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
La limitation se produit lorsque les opérations consomment plus de secondes d’unités de calcul (UCs) que la référence SKU de capacité l’autorise. Une limitation trop importante peut entraîner une dégradation de l’expérience de l’utilisateur final. Un locataire Microsoft Fabric peut créer plusieurs capacités et attribuer des espaces de travail à une capacité spécifique pour la facturation et le dimensionnement.
La limitation est appliquée au niveau de la capacité, ce qui signifie que si une capacité, ou un ensemble d’espaces de travail, peut voir ses performances réduites en raison d’une surcharge, d’autres capacités peuvent continuer à fonctionner normalement. Dans les cas où les fonctionnalités telles que les artefacts OneLake sont produites dans une capacité et consommées par une autre, l’état de limitation de la capacité consommatrice détermine si les appels à l’artefact sont limités.
Équilibre entre performances et fiabilité
Fabric est conçu pour offrir des performances rapides à ses clients. Les tâches qui peuvent prendre plusieurs minutes pour se terminer sur d’autres plateformes peuvent se terminer en quelques secondes sur Fabric. Les opérations volumineuses peuvent s’exécuter à n’importe quel moment de la journée sans avoir besoin de planifier soigneusement, car le calcul de ces opérations est réparti sur une période plus longue, sans ralentir l’opération. L’infrastructure permet cela en utilisant un bursting intégré et un lissage. Ils permettent aux capacités de s'auto-gérer et de s'auto-réparer lorsque des pics temporaires d'utilisation provoqueraient autrement la défaillance ou le ralentissement d'autres systèmes.
Mode en rafales
Pour garantir un niveau de performance rapide, Fabric utilise le bursting pour permettre aux opérations de s’exécuter aussi rapidement que possible. Le bursting permet aux opérations d’utiliser temporairement plus de calcul que le calcul approvisionné pour la référence SKU de capacité. Grâce au bursting, les utilisateurs obtiennent rapidement des résultats sans attendre. Le bursting permet également à une capacité plus petite d’exécuter des opérations plus volumineuses, qui nécessiteraient normalement une capacité plus coûteuse.
Lissage
Pour éviter de pénaliser les utilisateurs lorsque les opérations bénéficient d’un bursting, Fabric lisse, ou fait une moyenne, de l’utilisation UC d’une opération sur une période plus longue. Ce comportement permet aux utilisateurs de bénéficier d’un niveau de performance rapide et constant, sans subir de limitation.
Le lissage distribue l’utilisation des UC consommées sur des points de temps futurs. Les points de temps dans Fabric durent 30 secondes. Il y a 2 880 points temporels dans les prochaines 24 heures. Fabric gère automatiquement la quantité d’UCs de consommation dans chaque point de temps.
Le type d’utilisation d’une opération détermine le nombre de points de temps utilisés pour lissage. En savoir plus sur les Opérations Fabric.
- Les opérations interactives sont lissées sur un minimum de cinq minutes et jusqu’à 64 minutes en fonction de la quantité d’utilisation d’UC qu’elles consomment.
- Les tâches en arrière-plan sont ajustées sur une période de 24 heures, car elles ont généralement des durées de fonctionnement prolongées et une grande consommation d'unités de calcul.
En raison du lissage, seule une partie de l’utilisation des UC pour une opération s’applique à tous les points de temps individuels, ce qui réduit la limitation globale. L’utilisation des UC lissées s’accumule au fur et à mesure que les opérations s’exécutent. L'utilisation lissée est payée par les capacités futures, c'est-à-dire les unités de capacité disponibles à des moments futurs, car la capacité fonctionne de manière continue.
Le bursting et le lissage fonctionnent ensemble pour faciliter la tâche des utilisateurs de capacité. Par exemple, les utilisateurs passent généralement du temps à planifier des travaux et à les répartir au cours de la journée. Avec le lissage, le coût de calcul des travaux en arrière-plan est lissé sur 24 heures. Cela signifie que les travaux planifiés peuvent tous s’exécuter simultanément sans provoquer de pics qui empêchent le démarrage des travaux. En même temps, les utilisateurs peuvent bénéficier de performances constamment rapides sans attendre que les travaux lents se terminent ou perdent du temps pour gérer les planifications des travaux.
Remarque
Le bursting et le lissage ne sont pas pris en charge lorsque l'administrateur de capacité a activé la facturation automatique à l'échelle pour Spark. Dans ce scénario, l’utilisation de Spark fonctionne en mode paiement à l'You-Go, et les concepts de rafale et de lissage ne s’appliquent pas.
Déclencheurs de limitation et étapes de limitation
Même si les capacités ont un lissage intégré qui réduit l’impact des pics d’utilisation, il est toujours possible de surcharger une capacité en exécutant trop d’opérations.
La capacité limite automatiquement les nouvelles opérations lorsqu’elle est surchargée. La limitation se produit par étapes progressives pour réduire l’impact sur les tâches importantes, telles que les actualisations de données.
Même lorsqu’une capacité fonctionne au-dessus de 100 % d’utilisation, Fabric n’applique pas immédiatement de limitation. Au lieu de cela, la capacité fournit une protection de dépassement qui permet de consommer 10 minutes de capacité future sans limitation. Ce comportement offre une protection intégrée limitée contre les augmentations, tout en fournissant aux utilisateurs des performances constamment rapides sans interruptions.
La limitation démarre lorsqu’une capacité utilise toutes ses ressources UC pour les 10 prochaines minutes. La première phase de limitation applique 20 secondes de retard aux nouvelles opérations interactives. La deuxième phase de limitation rejette les nouvelles opérations interactives lorsqu’une capacité utilise toutes ses ressources UC pour l’heure suivante. Pendant cette phase, les opérations en arrière-plan sont autorisées à démarrer et à s’exécuter. La troisième phase de limitation consiste à rejeter toutes les nouvelles demandes, qu'elles soient interactives ou en arrière-plan, lorsque la capacité a épuisé toutes ses ressources CU disponibles pour les 24 heures suivantes. La capacité continue de limiter les demandes jusqu’à ce que les UC consommées soient payées.
Remarque
Microsoft s’efforce d’améliorer la flexibilité des clients dans le cadre de l’utilisation du service, tout en équilibrant la nécessité de gérer l’utilisation de la capacité par les clients. Pour cette raison, Microsoft peut modifier ou mettre à jour la stratégie de limitation Fabric.
Le tableau récapitule les déclencheurs et les étapes de limitation.
| Utilisation | Limites de stratégie | Impact de l’expérience de la stratégie de la plateforme |
|---|---|---|
| Utilisation <= 10 minutes | Protection contre le dépassement | Les travaux peuvent consommer 10 minutes d’utilisation future de la capacité sans limitation. |
| Utilisation < 10 minutes <= 60 minutes | Retard des travaux interactifs | Les travaux interactifs demandés par l’utilisateur sont retardés de 20 secondes lors de l’envoi. |
| Utilisation < 60 minutes <= 24 heures | Rejet des travaux interactifs | Les travaux interactifs demandés par l’utilisateur sont rejetés. |
| Utilisation > 24 heures | Rejet des travaux en arrière-plan | Toutes les requêtes sont rejetées. |
Exemple de limites de lissage et de limitation
Voici un exemple illustrant le fonctionnement de lissage pour une opération en arrière-plan qui a consommé 1 CUHr (son utilisation équivaut à 1 CU pendant 1 heure). Les opérations en arrière-plan sont lissées sur 24 heures. La contribution d’une opération en arrière-plan à tout point dans le temps est # CUHrs pour l’opération / # de CUHrs au niveau de la référence SKU. Pour un F2, ce travail contribuerait pour 1 CUHr / 48CUhrs = ~2,1 % à chaque point de temps. L’impact sur les limites de limitation de 10 minutes et de 60 minutes est d’environ 2,1 %.
Voici le détail qui prend en charge l’exemple :
1 CUHr = 3 600 UC (1 CU * 60 minutes par heure * 60 secondes par minute)
Chaque point de temps est de 30 secondes. En 24 heures, il y a 2 880 points de temps (24 heures * 60 minutes * 2 points de temps par minute).
Étant donné que les 3 600 UCs sont lissées sur 24 heures, le travail contribue pour 3 600 UCs/2 880 points de temps à chaque point de temps de 30 secondes. Il contribue donc à 1,25 UCs par point de temps.
Le pourcentage de limitation à 10 minutes est basé sur le nombre total d’UCs disponibles au cours des 10 prochaines minutes de durée de bon fonctionnement de la capacité.
Une capacité F2 a 2 UC pour chaque seconde (soit 2 UCs). À chaque instant temporel, un F2 a 2 unités de calcul (UC) * 30 secondes = 60 UC de calcul.
La contribution du travail en arrière-plan à un point de temps individuel est de 1,25 UCs/60 UCs = ~2,1 % d’un point de temps individuel.
En 10 minutes, le F2 a 2 CU * 60 secondes * 10 minutes = 1 200 UNITÉS de calcul.
La partie du travail en arrière-plan qui a été lissée dans les 10 prochaines minutes de capacité est de 1,25 UCs * 2 points de temps par minute * 10 minutes = 25 UCs.
Par conséquent, le pourcentage de limitation de 10 minutes est de 25 UCs / 1 200 UCs = ~2,1 %.
De même, l’impact sur la limitation de 60 minutes du travail en arrière-plan est également d’environ 2,1 %.
Même si l’opération en arrière-plan a consommé plus d’UCs que ce qui est disponible dans l’intervalle de temps de 10 minutes suivant (il a consommé six fois la quantité), la capacité F2 n’est pas limitée, car le nombre total d’UCs est lissée sur 24 heures. En raison du lissage, seule une petite partie des UCs consommées s’applique à tout point de temps individuel.
Dépassements, report et réduction graduelle
Lorsque les opérations utilisent plus de capacité que la référence SKU prend en charge dans un point de temps unique, un dépassement est calculé. Les dépassements sont calculés après l’application du lissage. S’il y a des dépassements qui dépassent la fenêtre de limitation de 10 minutes autorisée, ils deviennent des UCs reportées.
La protection contre le dépassement garantit que la capacité n’est pas limitée tant que la fenêtre de limitation de 10 minutes n’est pas pleine. Il est conçu pour réduire la fréquence des retards interactifs en raison de pics temporaires d’utilisation.
Les UCs reportées sont appliquées à chaque point de temps suivant. Si un point de temps n’est pas plein, les UCs non utilisées réduisent la quantité des UCs reportées. La réduction est appelée épuisement.
L’application de la limitation se poursuit jusqu’à ce que la capacité inutilisée paye toutes les UCs reportées.
Capacités de surveillance pour la limitation
Les administrateurs de capacité peuvent configurer des alertes par e-mail pour être avertis lorsqu’une capacité consomme 100 % de ses UC approvisionnées. Les administrateurs peuvent également utiliser l’application de métriques de capacité pour passer en revue les niveaux de limitation de leur capacité.
Dimensionnement approprié et optimisation d’une capacité
Des niveaux de limitation constamment élevés indiquent la nécessité d’équilibrer la charge entre plusieurs capacités, ou d’augmenter la taille de la référence SKU de la capacité. Lorsque vous utilisez des références SKU F, vous pouvez augmenter et diminuer manuellement la taille de la référence SKU à tout moment dans les paramètres d’administration, ce qui vous permet de résoudre la limitation si nécessaire.
Comment savoir que la limitation de capacité se produit
Lorsqu’une capacité rejette les demandes, les utilisateurs voient des codes d’erreur spécifiques et du texte d’erreur :
- Code d’état
CapacityLimitExceeded - Message d’erreur :
Your organization's Fabric compute capacity has excceded its limits. Try again later. - Message d’erreur :
Cannot load model due to reaching capacity limits
Remarque
Une performance lente est souvent due à la conception de l'article. Un niveau de performance lent n’est que parfois dû à une limitation de la capacité.
Lorsqu’une capacité est surchargée, un administrateur de capacité peut utiliser l’application de métriques de capacité Fabric pour confirmer la limitation.
- La table Événements système de la page Calcul affiche l’historique des événements de limitation.
- Les graphiques Limitation de la page Calcul indiquent quand l’utilisation lissée dépasse l’une des limites de limitation.
Comment arrêter la limitation lorsqu’elle se produit
Les capacités sont auto-réparatrices. Vous pouvez donc toujours attendre que l'état de surcharge disparaisse avant d'envoyer de nouvelles demandes.
Toutefois, pour arrêter la limitation plus rapidement, vous pouvez utiliser les stratégies répertoriées ci-dessous.
Lorsque vous utilisez des capacités de référence SKU F, pour arrêter la limitation :
- Augmentez temporairement le SKU. En augmentant votre référence SKU, vous réduisez graduellement les reports plus rapidement, car chaque point de temps a une capacité d’inactivité plus importante.
- Suspendez, puis reprenez vos capacités. La suspension d’une capacité entraîne un événement de facturation pour l’utilisation future de la capacité cumulée. Lorsqu’une capacité démarre ou reprend, elle n’a aucune utilisation future de la capacité afin qu’elle puisse accepter immédiatement de nouvelles opérations.
Lorsque vous utilisez des capacités de référence SKU P, pour arrêter la limitation :
- Activez la mise à l’échelle automatique pour la capacité P.
Les opérations en cours d’exécution ne sont pas limitées
La limitation affecte uniquement les opérations demandées après le démarrage de la limitation de la capacité. Toutes les opérations, y compris celles de longue durée qui ont été soumises avant le début de la limitation du débit, sont autorisées à s’exécuter jusqu’à la fin. Ce comportement vous garantit que les opérations sont terminées, même en cas d’augmentation de l’utilisation de CU.
Protection de limitation composée
Dans Fabric, une opération déclenche souvent l’exécution d’autres éléments ou charges de travail. Il existe de nombreux exemples, mais un exemple classique consiste à afficher un rapport. Chaque visuel du rapport exécute une requête sur un modèle sémantique sous-jacent. Le modèle sémantique peut également lire le formulaire de données OneLake pour fournir le résultat de la requête. Chacune de ces demandes forme une chaîne.
Lorsqu’il existe une chaîne d’appels, il existe un risque de limitation composée, c’est-à-dire lorsque la limitation est appliquée plusieurs fois à la même requête. Fabric dispose d’une protection intégrée de limitation composée qui réduit la probabilité d’une limitation composée. Les charges de travail peuvent choisir d’utiliser cette protection.
Lorsque les charges de travail prennent en charge la protection de limitation composée, une requête n’est limitée qu’une seule fois pour chaque capacité qui participe à la chaîne. La décision de restriction de débit se produit au démarrage de la requête et s’applique à toutes les opérations de la chaîne.
Si une chaîne s’appuie sur plusieurs capacités, chaque capacité applique sa limitation une fois pour la première requête qu’elle reçoit dans la chaîne.
Les expériences de charge de travail suivantes prennent en charge la limitation composée :
- Modèles sémantiques qui se connectent à d’autres modèles sémantiques à l’aide de Direct Query.
- Requêtes DAX de rapports paginés vers des modèles sémantiques.
Le comportement de limitation est spécifique aux charges de travail Fabric
Bien que la plupart des produits Fabric suivent les règles de limitation mentionnées précédemment, il existe certaines exceptions.
Par exemple, les flux d’événements Fabric ont de nombreuses opérations qui peuvent s’exécuter pendant des années une fois qu’ils sont démarrés. La limitation des nouvelles opérations de flux d’événements n’aurait pas de sens. Par conséquent, la quantité de ressources CU allouée pour maintenir le flux ouvert est réduite tant que la capacité n’est pas à nouveau en bon état.
L’expérience Informations en temps réel constitue une autre exception : elle ne serait pas en temps réel si les opérations étaient retardées de 20 secondes. Par conséquent, Real-Time Intelligence n’applique pas la première phase de limitation avec des retards de 20 secondes à 10 minutes de capacité future. Real-Time Intelligence attend jusqu’à ce que la phase de rejet à 60 minutes de la capacité future commence à limiter. Ce comportement garantit que les utilisateurs peuvent continuer à bénéficier de performances en temps réel, même pendant les périodes de forte demande.
De même, presque toutes les opérations dans la catégorie Entrepôt sont signalées comme étant en arrière-plan pour tirer parti du lissage de 24 heures de l’activité qui permet d’avoir des modèles d’utilisation plus flexibles. Si vous classez tout l’entrepôt de données comme étant en arrière-plan, les pics d’utilisation de CU ne déclenchent pas trop rapidement de limitation. Certaines requêtes peuvent déclencher une chaîne d’opérations limitées différemment. Lorsqu’une opération interactive démarre une chaîne qui inclut une opération en arrière-plan, l’opération en arrière-plan peut devenir soumise à une limitation en tant qu’opération interactive.
Classifications interactives et en arrière-plan pour la limitation et le lissage
Certains administrateurs peuvent remarquer que les opérations sont parfois classées comme interactives et lissées en arrière-plan, ou vice versa. Cette distinction se produit parce que les systèmes de limitation de Fabric doivent appliquer des règles de limitation avant qu’une requête ne commence à s’exécuter.
Le système de limitation tente de classer avec précision les opérations lors de l’envoi. Parfois, lorsqu’une opération commence à s’exécuter, des informations plus détaillées sont disponibles qui modifient la catégorisation. Dans les scénarios ambigus, le système de régulation revient à considérer les opérations comme des tâches en arrière-plan, ce qui est dans l'intérêt de l'utilisateur.
Suivre les dépassements et les opérations rejetées
Vous pouvez voir si votre capacité est surchargée en examinant le graphique d’utilisation dans l’application Métriques de capacité Microsoft Fabric. Un pic qui dépasse la ligne indique un dépassement. Pour approfondir l’examen du dépassement, explorez la page des points de temps. Vous pouvez ensuite passer en revue vos opérations interactives et en arrière-plan et voir celles qui ont été responsables des dépassements.
Étant donné qu’une utilisation supérieure à 100 % ne signifie pas automatiquement une limitation, vous devez utiliser le graphique de limitation lors de l’évaluation des dépassements. À partir de là, vous pouvez ouvrir une table indiquant le nombre de minutes jusqu’au burndown, un graphique avec l’ajout, le burndown et le pourcentage cumulé, et bien plus encore. Minutes de réduction graduelle estime combien de temps la réduction graduelle prendra si aucune opération supplémentaire ne se produit dans la capacité.
Pour afficher un historique visuel de toute surutilisation de capacité, y compris les données de report, de cumul et de burndown de l’utilisation, cliquez sur l’onglet Dépassements. Vous pouvez modifier l’échelle visuelle des dépassements pour afficher 10 minutes, 60 minutes et 24 heures.
L’exploration de l’application Métriques de capacité Microsoft Fabric permet aux administrateurs de voir les opérations qui ont été rejetées lors d’un événement de limitation. Les informations sur ces opérations sont limitées, car elles n’ont jamais été autorisées à démarrer. L’administrateur peut voir le produit, l’utilisateur, l’ID d’opération et l’heure à laquelle la requête a été envoyée. Lorsqu’une requête est rejetée, les utilisateurs finaux reçoivent un message d’erreur qui leur demande de réessayer plus tard.
Calcul facturable et non facturable
Lorsque vous passez en revue l’utilisation de la capacité dans l’application de métriques de capacité, certaines opérations sont facturables et d’autres sont non facturables. Seules les opérations facturables sont incluses dans les calculs de limitation. Les fonctionnalités en préversion peuvent générer des opérations non facturables. Utilisez des opérations non facturables pour planifier à l’avance afin que votre capacité soit correctement dimensionnée lorsque ces fonctionnalités en préversion deviennent facturables.
Contenu connexe
- Installez l’application Métriques de capacité Microsoft Fabric pour surveiller les capacités Fabric.
- Comment redimensionner votre capacité.