Freigeben über


Die Fabric-Drosselungsrichtlinien

Drosselung tritt auf, wenn Vorgänge mehr Compute-Einheiten pro Sekunde (Compute Unit seconds, CUs) verbrauchen, als die Kapazitäts-SKU zulässt. Eine zu starke Drosselung kann zu einer beeinträchtigten Endbenutzererfahrung führen. Ein Microsoft Fabric-Mandant kann mehrere Kapazitäten erstellen und Arbeitsbereiche einer bestimmten Kapazität für Abrechnung und Größenanpassung zuweisen.

Eine Drosselung wird auf Kapazitätsebene angewendet, d. h. während eine Kapazität oder eine Gruppe von Arbeitsbereichen aufgrund einer Überladung eine geringere Leistung aufweisen, können andere Kapazitäten normal ausgeführt werden. In Fällen, in denen Funken wie OneLake-Artefakte in einer Kapazität erzeugt und von einer anderen verbraucht werden, bestimmt der Drosselungszustand der Verbrauchkapazität, ob Aufrufe des Artefakts gedrosselt werden.

Balance zwischen Leistung und Zuverlässigkeit

Fabric wurde entwickelt, um ihren Kunden eine schnelle Leistung zu bieten. Aufgaben, die auf anderen Plattformen mehrere Minuten dauern können, können in nur wenigen Sekunden auf Fabric abgeschlossen werden. Große Vorgänge können jederzeit ausgeführt werden, ohne dass eine sorgfältige Planung erforderlich ist, da die Berechnung für diese Vorgänge über einen längeren Zeitraum verteilt ist, ohne den Vorgang zu verlangsamen. Fabric ermöglicht dies mit integriertem Bursting und Glätten. Sie ermöglichen Kapazitäten, selbstverwaltend und selbstheilend zu sein, wenn temporäre Nutzungsspitzen andernfalls dazu führen würden, dass andere Systeme fehlschlagen oder sich verlangsamen.

Platzen

Um eine schnelle Leistung sicherzustellen, verwendet Fabric Bursting, damit Vorgänge mit maximaler Geschwindigkeit ausgeführt werden können. Bursting ermöglicht Vorgängen die vorübergehende Verwendung von mehr Compute als die bereitgestellten Computes für die Kapazitäts-SKU. Dank dem Bursting erhalten Benutzer schnell Ergebnisse, ohne warten zu müssen. Das Bursting ermöglicht es auch einer kleineren Kapazität, größere Vorgänge auszuführen, die normalerweise eine teurere Kapazität erfordern würden.

Glättung

Um zu vermeiden, dass Benutzer bestraft werden, wenn Vorgänge vom Bursting profitieren, glättet oder mittelt Fabric den CU-Verbrauch eines Vorgangs über einen längeren Zeitraum hinweg. Dieses Verhalten stellt sicher, dass Benutzer eine konsistent schnelle Leistung genießen können, ohne Drosselung zu erleben.

Das Glätten verteilt die verbrauchte CU-Nutzung über zukünftige Zeitpunkte. Zeiteinheiten in Fabric sind jeweils 30 Sekunden lang. In den nächsten 24 Stunden gibt es 2.880 Zeitpunkte. Fabric verwaltet automatisch die Anzahl der verbrauchten CUs in jedem Zeitpunkt.

Der Verwendungstyp eines Vorgangs bestimmt die Anzahl der zeitpunkte, die zum Glätten verwendet werden. Erfahren Sie mehr über Fabric-Vorgänge.

  • Interaktive Vorgänge werden über ein Minimum von fünf Minuten geglättet, und bis zu 64 Minuten, je nachdem, wie viel CU-Verbrauch sie nutzen.
  • Hintergrundvorgänge werden über einen Zeitraum von 24 Stunden geglättet, da sie in der Regel lange Laufzeiten und einen hohen CU-Verbrauch aufweisen.

Aufgrund der Glättung entfällt nur ein Teil des CU-Verbrauchs für einen Vorgang auf jeden einzelnen Zeitpunkt, was die Drosselung insgesamt reduziert. Der geglättete CU-Verbrauch kumuliert sich, wenn Vorgänge ausgeführt werden. Der geglättete Verbrauch wird durch zukünftige Kapazität bezahlt, was die in zukünftigen Zeitpunkten verfügbaren CUs sind, da die Kapazität kontinuierlich ausgeführt wird.

Bursting und Glätten arbeiten zusammen, um den Kapazitätsbenutzenden die Arbeit zu erleichtern. Beispielsweise verbringen Benutzer in der Regel Zeit damit, Jobs zu planen und sie über den Tag zu verteilen. Beim Glätten werden die Computekosten für Hintergrundaufträge über 24 Stunden geglättet. Dies bedeutet, dass geplante Aufträge gleichzeitig ausgeführt werden können, ohne Spitzen zu verursachen, die andernfalls den Start von Aufträgen blockieren würden. Gleichzeitig können Benutzer eine gleichbleibend schnelle Leistung genießen, ohne darauf zu warten, dass langsame Aufgaben abgeschlossen sind, oder Zeit mit der Verwaltung von Jobplänen zu verschwenden.

Hinweis

Bursting und Glättung werden nicht unterstützt, wenn ein Kapazitätsadministrator die Autoscale-Abrechnung für Spark aktiviert hat. In diesem Szenario wird die Spark-Nutzung in einem Pay-As-You-Go-Modus ausgeführt, und die Konzepte von Bursting und Glättung gelten nicht.

Drosselungstrigger und Drosselungsstufen

Obwohl Kapazitäten integrierte Glättungen aufweisen, die die Auswirkungen von Spitzen in der Nutzung reduzieren, ist es dennoch möglich, eine Kapazität zu überlasten , indem zu viele Vorgänge ausgeführt werden.

Die Kapazität drosselt neue Vorgänge automatisch, wenn sie überlastet ist. Drosselung erfolgt in progressiven Schritten, um die Auswirkungen auf wichtige Aufgaben wie Datenaktualisierungen zu minimieren.

Selbst wenn eine Kapazität über 100 % Auslastung läuft, wendet Fabric die Drosselung nicht sofort an. Stattdessen bietet die Kapazität einen Überkapazitätsschutz, durch den 10 Minuten zukünftiger Kapazität ohne Drosselung genutzt werden können. Dieses Verhalten bietet einen begrenzten integrierten Schutz vor Auftrieben und bietet benutzern eine konsistente schnelle Leistung ohne Unterbrechungen.

Die Drosselung beginnt, wenn eine Kapazität alle CU-Ressourcen für die nächsten 10 Minuten aufbraucht. Die erste Phase der Drosselung wendet 20 Sekunden Verzögerung für neue interaktive Vorgänge an. Die zweite Phase der Drosselung lehnt neue interaktive Vorgänge ab, wenn eine Kapazität ihre gesamten CU-Ressourcen für die nächste Stunde verbraucht hat. In dieser Phase können Hintergrundvorgänge gestartet und ausgeführt werden. In der dritten Phase der Drosselung werden aller neuen Anforderungen abgelehnt, interaktive und Hintergrundanforderungen, wenn die Kapazität alle verfügbaren CU-Ressourcen für die nächsten 24 Stunden aufbraucht. Die Kapazität drosselt Anforderungen so lange, bis die verbrauchten CUs abbezahlt ist.

Hinweis

Microsoft versucht, die Flexibilität der Kund*innen bei der Nutzung des Diensts zu verbessern und gleichzeitig die Notwendigkeit auszugleichen, die Kapazitätsauslastung der Kund*innen zu verwalten. Aus diesem Grund kann Microsoft die Fabric-Einschränkungsrichtlinie ändern oder aktualisieren.

In der Tabelle werden die Drosselungsauslöser und -stufen zusammengefasst.

Verwendung Richtlinienbeschränkungen Auswirkungen der Plattformrichtlinienerfahrung
Verbrauch <= 10 Minuten Überschreitungsschutz Aufträge können 10 Minuten zukünftigen Kapazitätseinsatz ohne Drosselung verbrauchen.
10 Minuten < Verbrauch <= 60 Minuten Interaktive Verzögerung Von Benutzern angeforderte interaktive Aufträge werden bei der Übermittlung um 20 Sekunden verzögert.
60 Minuten < Verbrauch <= 24 Stunden Interaktive Ablehnung Vom Benutzer angeforderte interaktive Aufträge werden abgelehnt.
Nutzung > 24 Stunden Hintergrundzurückweisung Alle Anforderungen werden abgelehnt.

Beispiel für Glättung und Drosselungsgrenzwerte

Hier ist ein anschauliches Beispiel für die Funktionsweise der Glättung für einen Hintergrundvorgang, der 1 CUHr genutzt hat (sein Verbrauch entspricht 1 CU für 1 Stunde). Hintergrundvorgänge werden über 24 Stunden geglättet. Der Beitrag eines Hintergrundvorgangs zu einem beliebigen Zeitpunkt ist die Anzahl der CUHrs für den Vorgang / Anzahl von CUHrs auf SKU-Ebene. Für einen F2 würde dieser Auftrag 1 CUHr / 48CUhrs = ca. 2,1 % zu jedem Zeitpunkt beitragen. Die Auswirkungen auf die Drosselungsgrenzwerte bei 10 Minuten und 60 Minuten betragen ca. 2,1 %.

Hier sehen Sie die Details, die das Beispiel unterstützen:

1 CUHr = 3.600 CUs (1 CU * 60 Minuten pro Stunde * 60 Sekunden pro Minute)

Jeder Zeitpunkt ist 30 Sekunden lang. In 24 Stunden gibt es 2.880 Zeitpunkte (24 Stunden * 60 Minuten * 2 Zeitpunkte pro Minute).

Da die 3600 CUs über 24 Stunden geglättet werden, trägt der Auftrag 3600 CUs/2880 Zeitpunkte zu jedem 30-Sekunden-Zeitpunkt bei. Er trägt also 1,25 CUs pro Zeitpunkt bei.

Der Prozentsatz der 10-Minuten-Drosselung basiert auf den insgesamt verfügbaren CUs in den nächsten 10 Minuten der Kapazitätsuptime.

Eine F2-Kapazität hat 2 CU für jede Sekunde (oder 2 CUs). Zu jedem Zeitpunkt hat ein F2 2 CUs × 30 Sekunden = 60 CUs Rechenkapazität.

Der Beitrag des Hintergrundauftrags zu jedem einzelnen Zeitpunkt beträgt 1,25 CUs/60 CUs = ca 2,1 % eines einzelnen Zeitpunkts.

In 10 Minuten hat F2 2 CU * 60 Sekunden * 10 Minuten = 1.200 CUs Rechenleistung.

Der Teil des Hintergrundauftrags, der in die nächsten 10-Minuten-Kapazität geglättet wurde, beträgt 1,25 CUs * 2 Zeitpunkte pro Minute * 10 Minuten = 25 CUs.

Der 10-Minuten-Drosselungsprozentsatz beträgt also 25 CUs / 1.200 CUs = ~2.1%.

Ebenso beträgt der Prozentsatz der 60-minütige Drosselungsauswirkung des Hintergrundauftrags auch ca. 2,1 %.

Obwohl der Hintergrundvorgang mehr CUs verbraucht hat als in der nächsten 10-Minuten-Zeitspanne verfügbar ist (er verbrauchte sechs Mal die Menge), wird die F2-Kapazität nicht gedrosselt, da die gesamten CUs über 24 Stunden geglättet werden. Aufgrund der Glättung entfällt nur ein kleiner Teil der verbrauchten CUs auf jeden einzelnen Zeitpunkt.

Überschreitung, Vortragen und Burndown

Wenn Vorgänge mehr Kapazität nutzen, als die SKU in einem einzelnen Zeitpunkt bereitstellt, wird eine Überschreitung berechnet. Überlastungen werden berechnet, nachdem die Glättung angewendet wurde. Wenn es Überschreitungen gibt, die das zulässige 10-minütige Drosselungsfenster überschreiten, werden sie zu Vortragen-CUs.

Der Überschreitungsschutz stellt sicher, dass die Kapazität erst gedrosselt wird, wenn das Drosselungsfenster von 10 Minuten voll ist. Sie ist darauf ausgelegt, die Häufigkeit interaktiver Verzögerungen aufgrund temporärer Auslastungsspitzen zu reduzieren.

Die Vortragen-CUs werden auf jeden nachfolgenden Zeitpunkt angewendet. Wenn ein Zeitpunkt nicht voll ist, verringern die nicht verwendeten CUs den Betrag der Vortragen-CUs. Die Reduzierung wird als Burndown bezeichnet.

Die Einschränkungserzwingung wird fortgesetzt, bis die nicht genutzte Kapazität alle Vortragen-CUs abbezahlt.

Überwachung der Kapazitäten auf Drosselung

Kapazitätsadministratoren können E-Mail-Benachrichtigungen einrichten, um benachrichtigt zu werden, wenn eine Kapazität 100% seiner bereitgestellten CU-Ressourcen verbraucht. Administratoren können auch die Kapazitätsmetriken-Anwendung verwenden, um die Drosselungsstufen ihrer Kapazitäten zu überprüfen.

Richtige Größenanpassung und Optimierung einer Kapazität

Konstant hohe Drosselungsebenen deuten darauf hin, dass ein Lastenausgleich über mehrere Kapazitäten hinweg oder eine Erhöhung der SKU-Größe der Kapazität erforderlich ist. Bei Verwendung von F-SKUs können Sie die SKU-Größe jederzeit in den Administratoreinstellungen manuell vergrößern und verkleinern, sodass Sie die Drosselung bei Bedarf beheben können.

Woran Sie erkennen, dass Kapazitätsdrosselung erfolgt

Wenn eine Kapazität Anforderungen ablehnt, sehen Benutzer bestimmte Fehlercodes und Fehlertext:

  1. Statuscode CapacityLimitExceeded
  2. Fehlermeldung Your organization's Fabric compute capacity has excceded its limits. Try again later.
  3. Fehlermeldung: Cannot load model due to reaching capacity limits

Hinweis

Langsame Leistung ist oft auf das Designs eines Elements zurückzuführen. Manchmal ist die langsame Leistung nur auf die Kapazitätsdrosselung zurückzuführen.

Wenn eine Kapazität überlastet ist, kann ein Kapazitätsadministrator die Fabric-Kapazitätsmetriken-App verwenden, um die Drosselung zu bestätigen.

  1. Die Tabelle "Systemereignisse " auf der Seite "Compute " zeigt den Verlauf von Drosselungsereignissen an.
  2. Die Drosselungsdiagramme auf der Compute-Seite zeigen an, wenn die geglättete Nutzung einen der Drosselungsgrenzwerte überschreitet.

So beenden Sie die Drosselung, wenn sie auftritt

Kapazitäten sind selbstheilend, sodass Sie immer warten können, bis der Überladenzustand beendet ist, bevor neue Anforderungen übermittelt werden.

Um die Drosselung jedoch schneller zu beenden, können Sie die unten aufgeführten Strategien verwenden.

So stoppen Sie die Drosselung bei Verwendung von F-SKU-Kapazitäten:

  • Erhöhen Sie die SKU vorübergehend. Indem Sie Ihre SKU erhöhen, beschleunigen Sie den Burndown des Vortragens, da jeder Zeitpunkt mehr Leerlaufkapazität hat.
  • Halten Sie den Vorgang an, und setzen Sie Ihre Kapazität dann fort. Das Anhalten einer Kapazität führt zu einem Abrechnungsereignis für den kumulierten zukünftigen Kapazitätsverbrauch. Wenn eine Kapazität gestartet oder fortgesetzt wird, hat sie keine zukünftige Kapazitätsauslastung, sodass neue Vorgänge sofort akzeptiert werden können.

So stoppen Sie die Drosselung bei Verwendung von P-SKU-Kapazitäten:

In-Flight-Vorgänge werden nicht gedrosselt

Die Drosselung wirkt sich nur auf Vorgänge aus, die nach dem Start der Kapazitätsdrosselung angefordert werden. Alle Vorgänge, einschließlich zeitintensive, die vor Beginn der Drosselung übermittelt wurden, dürfen bis zum Ende ausgeführt werden. Dieses Verhalten gibt Ihnen die Gewissheit, dass Operationen abgeschlossen werden, auch während CU-Verbrauchsspitzen.

Verbunddrosselungsschutz

In Fabric löst ein Vorgang häufig andere Elemente oder Workloads aus, um den Vorgang abzuschließen. Es gibt viele Beispiele, aber ein typisches ist das Betrachten eines Berichts. Jedes visuelle Element im Bericht führt eine Abfrage für ein zugrunde liegendes Semantikmodell aus. Das semantische Modell kann auch Datenformular OneLake lesen, um das Abfrageergebnis bereitzustellen. Jede dieser Anforderungen bildet eine Kette.

Wenn eine Kette von Anrufen vorhanden ist, besteht das Risiko einer zusammengesetzten Drosselung, bei der die Drosselung mehrmals auf dieselbe Anforderung angewendet wird. Fabric verfügt über einen integrierten Verbunddrosselungsschutz, der die Wahrscheinlichkeit des Auftretens einer Verbunddrosselung verringert. Workloads können sich für die Verwendung dieses Schutzes entscheiden.

Wenn Workloads den Verbunddrosselungsschutz unterstützen, wird eine Anforderung nur einmal für jede Kapazität gedrosselt, die an der Kette beteiligt ist. Die Drosselungsentscheidung wird getroffen, sobald die Anforderung beginnt und gilt für alle Vorgänge in der Kette.

Wenn eine Kette mehr als eine Kapazität benötigt, erzwingt jede Kapazität die Drosselung einmal für die erste Anforderung, die sie in der Kette empfängt.

Die folgenden Workloaderfahrungen unterstützen eine Verbunddrosselung:

  • Semantische Modelle, die mit Direct Query eine Verbindung mit anderen semantischen Modellen herstellen.
  • DAX-Abfragen von paginierten Berichten zu semantischen Modellen.

Das Drosselungsverhalten ist spezifisch für Fabric-Workloads

Auch wenn die meisten Fabric-Produkte den zuvor erwähnten Drosselungsregeln folgen, gibt es einige Ausnahmen.

Beispielsweise verfügen Fabric-Eventstreams über viele Vorgänge, die nach dem Starten jahrelang ausgeführt werden können. Die Drosselung neuer Eventstream-Operationen wäre daher nicht sinnvoll. Stattdessen wird die Menge der CU-Ressourcen, die dem Offenhalten des Streams zugeordnet ist, reduziert, bis mit der Kapazität wieder alles in Ordnung ist.

Eine weitere Ausnahme ist Echtzeitintelligenz, welche nicht in Echtzeit wäre, wenn Vorgänge um 20 Sekunden verzögert würden. Daher wendet Real-Time Intelligence nicht die erste Drosselungsstufe mit 20-sekündigen Verzögerungen bei einer zukünftig verfügbaren Kapazität von 10 Minuten an. Echtzeitintelligenz wartet, bis die Ablehnungsphase bei 60 Minuten zukünftiger Kapazität liegt, um mit der Drosselung zu beginnen. Dieses Verhalten stellt sicher, dass Benutzer auch in Zeiten hoher Nachfrage weiterhin von Echtzeitleistung profitieren können.

Ebenso werden fast alle Vorgänge in der Kategorie Warehouse als Hintergrund gemeldet, um die 24-Stunden-Glättung der Aktivität zu nutzen und die flexibelsten Nutzungsmuster zu ermöglichen. Das Klassifizieren aller Data Warehouses als Hintergrund verhindert, dass Spitzen in der CU-Auslastung zu schnell Drosselungen auslösen. Einige Anforderungen lösen möglicherweise eine Kette von Vorgängen aus, die unterschiedlich gedrosselt werden. Wenn ein interaktiver Vorgang eine Kette startet, die einen Hintergrundvorgang enthält, kann der Hintergrundvorgang als interaktiver Vorgang einer Drosselung unterliegen.

Interaktive und Hintergrundklassifizierungen für Drosselung und Glättung

Einige Administrator*innen stellen möglicherweise fest, dass Operationen manchmal als „interaktiv“ und „geglättet als Hintergrund“ klassifiziert werden oder umgekehrt. Dieser Unterschied tritt auf, da die Fabric-Drosselungssysteme von Drosselungsregeln anwenden müssen, bevor eine Anforderung ausgeführt wird.

Das Drosselungssystem versucht, Vorgänge bei der Übermittlung genau zu kategorisieren. Wenn ein Vorgang mit der Ausführung beginnt, werden detailliertere Informationen verfügbar, die die Kategorisierung ändern. In mehrdeutigen Szenarien greift das Drosselungssystem auf die Klassifizierung von Vorgängen als Hintergrund zurück, was für den Benutzer am besten geeignet ist.

Nachverfolgen von Überschreitungen und abgelehnten Operationen

Sie können sehen, ob Ihre Kapazität überlastet ist, indem Sie das Diagramm "Auslastung" in der Microsoft Fabric-Kapazitätsmetriken-App überprüfen. Eine Spitze, die über die Linie geht, zeigt eine Überlastung an. Um die Überschreitung weiter zu untersuchen, führen Sie einen Drilldown zur Zeitpunktseite durch. Anschließend können Sie Ihre interaktiven und Hintergrundvorgänge überprüfen und sehen, welche für die Überschreitungen verantwortlich waren.

Da eine Auslastung über 100 % nicht automatisch Drosselung bedeutet, müssen Sie beim Auswerten von Überschreitungen das Diagramm Drosselung verwenden. Von dort aus können Sie eine Tabelle öffnen, die Minuten zum Burndown anzeigt, ein Diagramm mit hinzugefügten, Burndown- und kumulierten Prozent und mehr. „Minuten zum Burndown“ schätzt, wie lange Burndown dauern würde, wenn keine weiteren Vorgänge in der Kapazität auftreten.

Animation, die die Drillthrough-Option für einen ausgewählten Zeitpunkt anzeigt.

Wenn Sie einen visuellen Verlauf der Überlastung von Kapazität anzeigen möchten, einschließlich Vortrags-, kumulativen und Burndowndaten der Nutzungsdaten, wechseln Sie zur Registerkarte Überschreitungen. Sie können die visuelle Skalierung der Überschreitungen ändern, um 10 Minuten, 60 Minuten und 24 Stunden anzuzeigen.

Animation, die die Überschreitungen im Laufe der Zeit zeigt.

Der Drilldown der Microsoft Fabric Capacity Metrics-App ermöglicht Administratoren das Anzeigen von Vorgängen, die während eines Drosselungsereignisses abgelehnt wurden. Es gibt nur begrenzte Informationen zu diesen Vorgängen, da sie nie starten dürfen. Der Administrator kann das Produkt, den Benutzer, die Vorgangs-ID und die Uhrzeit der Übermittlung der Anforderung anzeigen. Wenn eine Anforderung abgelehnt wird, erhalten Endbenutzer*innen eine Fehlermeldung, in der sie auffordert werden, es später erneut zu versuchen.

Abrechenbare und nicht abrechenbare Compute

Wenn Sie die Kapazitätsauslastung in der Kapazitätsmetriken-App überprüfen, können einige Vorgänge abgerechnet werden, und andere sind nicht abrechnend. Nur abrechenbare Vorgänge sind in Drosselungsberechnungen enthalten. Vorschaufunktionen können vorgänge generieren, die nicht in Rechnung gestellt werden können. Verwenden Sie nicht abrechenbare Vorgänge, um vorauszuplanen, damit ihre Kapazität die richtige Größe aufweist, wenn diese Vorschaufeatures abrechenbar werden.