Bewertung der Auslastung der Premium-Kapazität

Tipp

In diesem Artikel wird erläutert, wie Sie Ihre Premium-Kapazitätsauslastung auswerten. Es werden Konzepte wie Überladung und Autoskalierung behandelt. Sie können sich auch diese Videos ansehen, die einige der in diesem Artikel beschriebenen Premium-Features veranschaulichen.

Um CPU-Durchsatzbeschränkungen zu erzwingen, wertet Power BI den Durchsatz Ihrer Premium-Kapazität kontinuierlich aus.

und zwar alle 30 Sekunden. Hierzu wartet Power BI, bis Vorgänge abgeschlossen sind, sammelt die Angaben zur Ausführungsdauer auf den CPUs der physischen Knoten im gemeinsam genutzten Pool, aggregiert diese dann für alle Vorgänge in Ihrer Kapazität in 30-sekündigen CPU-Intervallen und vergleicht schließlich die Ergebnisse mit dem von Ihrer erworbenen Kapazität unterstützten Durchsatz.

Die folgende Abbildung veranschaulicht, wie Premium Abfragen auswertet und abschließt.

Diagramm: Premium Gen2 beim Auswerten und Verarbeiten von Abfragen

Sehen wir uns ein Beispiel an: Ein P1 mit acht V-Kernen kann $8\times{30}=240$ Sekunden der V-Core-Ausführungszeit unterstützen, die auch als CPU-Zeit bezeichnet wird.

Die Aggregation ist komplex. Hierfür werden spezielle Algorithmen für verschiedene Workloads und für verschiedene Arten von Vorgängen verwendet, wie in den folgenden Punkten beschrieben:

  • Langsam ausgeführte Vorgänge, z. B. die Aktualisierung von Datasets und Dataflows, werden als Hintergrundvorgänge betrachtet, weil sie in der Regel im Hintergrund ausgeführt und nicht von Benutzern aktiv überwacht oder angezeigt werden. Hintergrundvorgänge dauern lang, und ihr Abschluss erfordert eine hohe CPU-Leistung während dieses langwierigen Prozesses. Power BI verteilt die CPU-Kosten von Hintergrundvorgängen auf einen Zeitraum von 24 Stunden, um zu verhindern, dass die maximale Ressourcennutzung für Kapazitäten erreicht wird, weil zu viele Aktualisierungen gleichzeitig ausgeführt werden. Dies ermöglicht es Power BI Premium Abonnenten, so viele Hintergrundvorgänge auszuführen, wie es die erworbene Kapazitäts-SKU erlaubt, und schränkt sie nicht wie die ursprüngliche Premium-Generation ein.

  • Schnelle Vorgänge wie Abfragen und das Laden von Berichten werden als interaktive Vorgänge angesehen. Die für das Abschließen dieser Vorgänge erforderliche CPU-Zeit wird aggregiert, um die Anzahl der nach dem Abschluss betroffenen 30-Sekunden-Zeitfenster zu minimieren.

Planung von Premium-Hintergrundvorgängen

Aktualisierungen werden für Premium-Kapazitäten zum geplanten Zeitpunkt oder in der Nähe ausgeführt, unabhängig davon, wie viele andere Hintergrundvorgänge für die gleiche Zeit geplant wurden. Datasets und Dataflows, die aktualisiert werden, werden auf einem physischen Verarbeitungsknoten platziert, der über ausreichend Arbeitsspeicher verfügt, um sie zu laden und anschließend mit dem Aktualisierungsvorgang zu beginnen.

Beim Verarbeiten der Aktualisierung verbrauchen Datasets möglicherweise mehr Arbeitsspeicher, um den Aktualisierungsvorgang abzuschließen. Die Aktualisierungs-Engine stellt sicher, dass kein Element die von der Basis-SKU zugelassene Arbeitsspeichermenge überschreiten kann (z. B. 25 GB bei einem P1-Abonnement oder 50 GB bei einem P2-Abonnement).

Erzwingen von Kapazitätsgrößenlimits beim Anzeigen von Berichten

Power BI Premium wertet die Auslastung aus, indem Nutzungsdatensätze alle 30 Sekunden aggregiert werden. Jede Auswertung besteht aus zwei verschiedenen Aggregationen:

  • Interaktive Auslastung
  • Hintergrundauslastung

Für die interaktive Auslastung werden alle interaktiven Vorgänge ausgewertet, die am Ende des 30-sekündigen Auswertungszeitraums (oder kurz davor) abgeschlossen wurden.

Für die Hintergrundauslastung werden alle Hintergrundvorgänge ausgewertet, die in den letzten 24 Stunden abgeschlossen wurden. Hierbei verursacht jeder Hintergrundvorgang nur 1/2880 seiner gesamten CPU-Kosten, denn es gibt im Laufe von 24 Stunden jeweils 2880 Auswertungszeiträume.

Jede Kapazität besteht aus einer definierten Anzahl von V-Kernen. Die in Auslastungsdatensätzen gemessene CPU-Zeit spiegelt die Auslastung der V-Kerne wider, und diese Auslastung führt zu einer automatischen Skalierung.

Wenn Sie über ein P1-Abonnement mit acht V-Kernen verfügen, entspricht jedes Auswertungszykluskontingent $8\times{30}=240$ Sekunden CPU-Auslastung. Wenn die Summe der interaktiven Und Hintergrundnutzungen den gesamten V-Kern-Angebot in Ihrer Kapazität überschreitet und Sie die automatische Skalierung nicht optional aktiviert haben, überschreitet die Workload für Ihre Premium-Kapazität Ihre verfügbaren Ressourcen, auch Als Kapazitätsschwellenwert bezeichnet. Die folgende Abbildung veranschaulicht diese Bedingung, die als Überladung bezeichnet wird, wenn die automatische Skalierung nicht aktiviert ist.

Diagramm, das die Überladungsbedingung in der Premium Gen2-Kapazität zeigt

Wenn die automatische Skalierung optional aktiviert ist, wird Ihre Kapazität für die nächsten 24 Stunden automatisch skaliert (erhöht), wenn Ihre CPU-Auslastung das gesamte V-Core-Kontingent in Ihrer Kapazität überschreitet.

In der folgenden Abbildung wird gezeigt, wie die Autoskalierung funktioniert.

Diagramm, das den automatischen Skalierungsvorgang Premium Gen2-Kapazität zeigt

Die automatische Skalierung berücksichtigt immer Ihre aktuelle Kapazitätsgröße, um zu bewerten, wie viel Sie verwenden. Bei der automatischen Skalierung wird Ihrer Kapazität ein V-Kern hinzugefügt. Wenn Sie also eine P1-SKU mit acht V-Kernen verwenden, beträgt Ihre maximale Kapazität jetzt 270 Sekunden ($8\times{30}+1\times{30}$) CPU-Zeit in einem Auswertungszyklus.

Die Autoskalierung stellt immer sicher, dass kein einzelner interaktiver Vorgang Ihre gesamte Kapazität nutzen kann, und es müssen mindestens zwei Vorgänge pro Auswertungszeitraum ausgeführt werden, damit die Autoskalierung initiiert wird.

Verwenden von Premium ohne automatische Skalierung

Wenn die Auslastung einer Kapazität bei über 100 % der Ressourcen liegt und keine Autoskalierung initiiert werden kann, weil diese deaktiviert oder der Höchstwert für die V-Kerne bereits erreicht ist, wird die Kapazität vorübergehend in den Modus Interactive Request Delay (Verzögerung von interaktiven Anforderungen) versetzt. Im Modus Interactive Request Delay (Verzögerung von interaktiven Anforderungen) wird jede interaktive Anforderung (z. B. das Laden von Berichten oder die Visualinteraktion) verzögert zur Ausführung an die Engine gesendet.

Die Kapazität bleibt im Modus Interactive Request Delay (Verzögerung von interaktiven Anforderungen), wenn bei der vorherigen Auswertung eine Ressourcenauslastung von mehr als 100 Prozent festgestellt wurde.

Konfigurieren der automatischen Skalierung

Befolgen Sie zum Konfigurieren der automatischen Skalierung für eine Power BI Premium Kapazität die Anweisungen unter Verwenden der automatischen Skalierung mit Power BI Premium.

Nächste Schritte

Weitere Fragen? Stellen Sie Ihre Frage in der Power BI-Community.