Automatisches Skalieren der Einheiten des Azure Web PubSub-Diensts
Wichtig
Die automatische Skalierung ist nur im Premium-Tarif des Azure Web PubSub-Diensts verfügbar.
Im Premium-Tarif des Azure Web PubSub-Diensts wird das Feature Autoskalierung unterstützt, das eine Implementierung der Azure Monitor-Autoskalierung ist. Mithilfe der Autoskalierung können Sie die Anzahl der Einheiten für Ihren Web PubSub-Dienst automatisch skalieren, um sie an die tatsächliche Auslastung des Diensts anzupassen. Die Autoskalierung kann Ihnen dabei helfen, Leistung und Kosten für Ihre Anwendung zu optimieren.
Azure Web PubSub fügt eigene Dienstmetriken hinzu. Die meisten Benutzeroberflächen werden jedoch gemeinsam mit anderen Azure-Dienste genutzt, die die automatische Skalierung unterstützen und ist mit diesen identisch. Wenn Sie noch nicht mit dem Thema Azure Monitor-Metriken vertraut sind, lesen Sie Erläuterungen zur Azure Monitor-Metrikaggregation und -anzeige, bevor Sie sich in Metriken des Web PubSub-Diensts einarbeiten.
Grundlegendes zur Autoskalierung im Web PubSub-Dienst
Mithilfe der Autoskalierung können Sie Bedingungen festlegen, mit denen die Einheiten, die dem Web PubSub-Dienst zugewiesen sind, während der Dienstausführung dynamisch geändert werden. Die Bedingungen für die Autoskalierung basieren auf Metriken, z. B. der Serverlast. Die Autoskalierung kann auch so konfiguriert werden, dass sie nach einem Zeitplan ausgeführt wird, z. B. jeden Tag zwischen bestimmten Uhrzeiten.
Mithilfe der Autoskalierung können Sie z. B. die folgenden Skalierungsszenarien implementieren:
- Erhöhen der Einheiten, wenn die Auslastung des Verbindungskontingents über 70 % liegt
- Verringern der Einheiten, wenn die Serverlast unter 20 % liegt
- Erstellen Sie einen Zeitplan, um während Spitzenzeiten zusätzliche Einheiten hinzuzufügen und während ruhigeren Phasen die Einheiten zu reduzieren.
Mehrere Faktoren können die Leistung des Web PubSub-Diensts beeinflussen. Es gibt keine einzelne Metrik, die alle Aspekte der Systemleistung widerspiegelt. Wenn Sie beispielsweise eine große Anzahl von Nachrichten senden, müssen Sie möglicherweise aufskalieren, auch wenn das Verbindungskontingent relativ niedrig ist. Eine Kombination aus Auslastung des Verbindungskontingents und Serverlast gibt einen Hinweis auf die Gesamtlast des Systems. Es gelten die folgenden Richtlinien:
- Skalieren Sie auf, wenn die Verbindungsanzahl über 80–90 % liegt. Wenn Sie schon vor dem Ausschöpfen der Verbindungsanzahl aufskalieren, stellen Sie sicher, dass Sie über ausreichend Puffer verfügen, um neue Verbindungen anzunehmen, bevor die Aufskalierung wirksam wird.
- Skalieren Sie auf, wenn die Serverlast über 80–90 % liegt. Durch die Skalierung stellen Sie sicher, dass der Dienst über genügend Kapazitäten verfügt, um die Leistung während des Aufskalierungsvorgangs aufrechtzuerhalten.
Die Autoskalierung wird in der Regel 3–5 Minuten nach dem Auslösen wirksam. Es ist wichtig, die Einheiten nicht zu oft zu ändern. Eine gute Faustregel besteht darin, nach einem Autoskalierungsvorgang 30 Minuten zu warten, bevor Sie einen weiteren Autoskalierungsvorgang ausführen. In einigen Fällen müssen Sie möglicherweise experimentieren, um das optimale Intervall für die Autoskalierung zu finden.
Benutzerdefinierte Autoskalierungseinstellungen
Öffnen Sie die Seite mit den Autoskalierungseinstellungen:
Öffnen Sie das Azure-Portal.
Öffnen Sie die Seite des Diensts Web PubSub.
Wählen Sie im Menü auf der linken Seite unter Einstellungen die Option Aufskalieren aus.
Wählen Sie die Registerkarte Konfigurieren aus. Wenn Sie über eine Web PubSub-Instanz im Premium-Tarif verfügen, werden für Wählen Sie aus, wie Ihre Ressource skaliert werden soll zwei Optionen gezeigt:
- Manuelle Skalierung ermöglicht Ihnen, die Anzahl der Einheiten manuell zu ändern.
- Benutzerdefinierte Autoskalierung ermöglicht Ihnen, Bedingungen für die Autoskalierung basierend auf Metriken und/oder einem Zeitplan zu erstellen.
Wählen Sie Benutzerdefinierte Autoskalierung aus. Auf dieser Seite verwalten Sie die Bedingungen für die Autoskalierung Ihres Azure Web PubSub-Diensts.
Standardskalierungsbedingung
Wenn Sie benutzerdefinierte Einstellungen für die Autoskalierung zum ersten Mal öffnen, wird die Standardbedingung Standard angezeigt, die bereits für Sie erstellt wurde. Diese Skalierungsbedingung wird ausgeführt, wenn keine der anderen Skalierungsbedingungen die festgelegten Kriterien erfüllt. Sie können die Bedingung Standard nicht löschen, aber Sie können sie umbenennen, die Regeln ändern und die Aktion anpassen, die bei der Autoskalierung ausgeführt wird.
Bei Verwendung der Standardbedingung für die Autoskalierung können Sie keinen festen Tag oder Datumsbereich festlegen. Die Standardbedingung unterstützt nur die Skalierung auf einen Einheitenbereich. Zum Skalieren nach einem Zeitplan müssen Sie eine neue Skalierungsbedingung hinzufügen.
Die Autoskalierung wird erst wirksam, wenn Sie die Standardbedingung zum ersten Mal speichern, nachdem Sie Benutzerdefinierte Autoskalierung ausgewählt haben.
Hinzufügen oder Ändern einer Skalierungsbedingung
Es gibt zwei Optionen für das Skalieren Ihrer Azure Web PubSub-Ressource:
- Basierend auf einer Metrik skalieren: Die Skalierung erfolgt innerhalb von Einheitengrenzwerten basierend auf einer dynamischen Metrik. Es muss mindestens eine Skalierungsregel definiert werden, um die Kriterien festzulegen, die zum Auswerten der Metrik verwendet werden.
- Auf bestimmte Einheiten skalieren: Die Skalierung erfolgt auf eine bestimmte Anzahl von Einheiten basierend auf einem Datumsbereich oder einem wiederholten Zeitplan.
Skalierung basierend auf einer Metrik
Im Folgenden sind die Schritte gezeigt, mit denen Sie eine Bedingung hinzufügen, mit der die Anzahl von Einheiten erhöht wird (aufskalieren), wenn die Auslastung des Verbindungskontingents mehr als 70 % beträgt, bzw. mit der die Anzahl von Einheiten reduziert wird (abskalieren), wenn die Auslastung des Verbindungskontingents bei weniger als 20 % liegt. Die Erhöhung oder Verringerung erfolgt zwischen verfügbaren Einheiten.
Wählen Sie auf der Seite Aufskalieren für Auswählen, wie Ihre Ressource skaliert werden soll die Option Benutzerdefinierte Autoskalierung aus.
Wählen Sie für Skalierungsmodus die Option Basierend auf einer Metrik skalieren aus.
Wählen Sie + Regel hinzufügen aus.
Führen Sie auf der Seite Skalierungsregel die folgenden Schritte aus:
- Wählen Sie in der Dropdownliste Metrikname eine Metrik aus. In diesem Beispiel wird Connection Quota Utilization (Auslastung des Verbindungskontingents) verwendet.
- Wählen Sie einen Operator und Schwellenwerte aus. In diesem Beispiel werden für Metrikschwellenwert zum Auslösen von Skalierungsaktion die Operatoren Größer als und 70 verwendet.
- Wählen Sie im Abschnitt Aktion einen Vorgang aus. In diesem Beispiel wird Erhöhen verwendet.
- Wählen Sie anschließend Hinzufügen aus.
Wählen Sie erneut + Regel hinzufügen aus, und führen Sie auf der Seite Skalierungsregel die folgenden Schritte aus:
- Wählen Sie in der Dropdownliste Metrikname eine Metrik aus. In diesem Beispiel wird Connection Quota Utilization (Auslastung des Verbindungskontingents) verwendet.
- Wählen Sie einen Operator und Schwellenwerte aus. In diesem Beispiel werden für Metrikschwellenwert zum Auslösen von Skalierungsaktion die Operatoren Weniger als und 20 verwendet.
- Wählen Sie im Abschnitt Aktion einen Vorgang aus. In diesem Beispiel wird Verringern verwendet.
- Wählen Sie anschließend Hinzufügen aus.
Legen Sie für Minimum, Maximum und Standard die jeweilige Anzahl von Einheiten fest.
Wählen Sie auf der Symbolleiste Speichern aus, um die Einstellung für die Autoskalierung zu speichern.
Skalieren auf bestimmte Einheiten
Führen Sie die folgenden Schritte aus, um die Regel so zu konfigurieren, dass auf eine bestimmte Anzahl von Einheiten skaliert wird.
- Wählen Sie auf der Seite Aufskalieren für Auswählen, wie Ihre Ressource skaliert werden soll die Option Benutzerdefinierte Autoskalierung aus.
- Wählen Sie für Skalierungsmodus die Option Scale to a specific units (Auf bestimmte Anzahl von Einheiten skalieren) aus.
- Wählen Sie unter Einheiten die Anzahl der Standardeinheiten aus.
Hinzufügen weiterer Bedingungen
Im vorherigen Abschnitt haben Sie erfahren, wie Sie eine Standardbedingung für die Autoskalierungseinstellung hinzufügen. In diesem Abschnitt wird gezeigt, wie Sie weitere Bedingungen zur Einstellung für die Autoskalierung hinzufügen.
- Wählen Sie auf der Seite Aufskalieren für Auswählen, wie Ihre Ressource skaliert werden soll die Option Benutzerdefinierte Autoskalierung aus.
- Wählen Sie im Block Standard die Option Skalierungsbedingung hinzufügen aus.
- Überprüfen Sie, ob die Option Basierend auf einer Metrik skalieren ausgewählt ist.
- Wählen Sie + Regel hinzufügen zum Hinzufügen einer Regel aus, um Einheiten zu erhöhen, wenn der Wert für Connection Quota Utilization (Auslastung des Verbindungskontingents) 70 Prozent überschreitet. Führen Sie die im Abschnitt Standardbedingung beschriebenen Schritte aus.
- Legen Sie für Minimum, Maximum und Standard die jeweilige Anzahl von Einheiten fest.
- Im Gegensatz zur Standardbedingung kann bei benutzerdefinierten Bedingungen zudem ein Zeitplan festgelegt werden. Dabei können Sie entweder ein Start- und ein Enddatum für die Bedingung oder bestimmte Wochentage (Montag, Dienstag usw.) angeben.
- Wenn Sie Start-/Enddatum angeben auswählen, treffen Sie für die zu verwendende Bedingung eine Auswahl für Zeitzone, Startdatum und -uhrzeit sowie Enddatum und -uhrzeit (wie in der folgenden Abbildung gezeigt).
- Bei Auswahl von An bestimmten Tagen wiederholen wählen Sie die Wochentage, die Zeitzone, die Startzeit und die Endzeit für die Bedingung aus.
Nächste Schritte
Weitere Informationen zum Verwalten der Autoskalierung über die Azure-Befehlszeilenschnittstelle finden Sie unter az monitor autoscale.