Horizontales Hochskalieren von Azure Analysis Services

2025-06-06

Mit einer Skalierung können Clientabfragen auf mehrere Abfragereplikate in einem Abfragepool verteilt werden, wodurch die Antwortzeiten bei hohen Abfrageworkloads reduziert werden. Darüber hinaus kann die Verarbeitung vom Abfragepool getrennt werden, um sicherzustellen, dass Clientabfragen nicht durch Verarbeitungsvorgänge beeinträchtigt werden. Horizontales Hochskalieren kann im Azure-Portal oder mithilfe der Analysis Services-REST-API konfiguriert werden.

Horizontales Hochskalieren ist für Server im Standardtarif verfügbar. Jedes Abfragereplikat wird mit dem gleichen Tarif abgerechnet wie Ihr Server. Alle Abfragereplikate werden in der gleichen Region wie Ihr Server erstellt. Die Anzahl der von Ihnen konfigurierbaren Abfragereplikate ist durch die Region, in der sich Ihr Server befindet, eingeschränkt. Weitere Informationen finden Sie unter Verfügbarkeit nach Region. Durch horizontale Hochskalierung erhöht sich nicht die Menge an verfügbarem Arbeitsspeicher für Ihren Server. Zur Erhöhung des Arbeitsspeichers müssen Sie Ihren Plan upgraden.

Gründe für die Aufskalierung

In einer typischen Serverbereitstellung fungiert ein einzelner Server sowohl als Verarbeitungs- als auch als Abfrageserver. Wenn die Anzahl von Clientabfragen für Modelle auf dem Server die QPUs (Query Processing Units) für den Tarif Ihres Servers übersteigt oder die Modellverarbeitung mit einem hohen Aufkommen von Abfrageworkloads zusammenfällt, kann sich dies negativ auf die Leistung auswirken.

Mit Scale-Out können Sie einen Abfragepool mit bis zu sieben weiteren Abfragereplikaten (insgesamt acht einschließlich des primären Servers) erstellen. Sie können die Anzahl von Replikaten im Abfragepool jederzeit skalieren, um die QPU-Anforderungen in kritischen Zeiten zu erfüllen, und Sie können einen Verarbeitungsserver aus dem Abfragepool herauslösen.

Verarbeitungsworkloads werden unabhängig von der Anzahl von Abfragereplikaten in einem Abfragepool nicht auf Abfragereplikate verteilt. Der primäre Server fungiert als Verarbeitungsserver. Abfragereplikate bedienen ausschließlich Abfragen für die Modelldatenbanken, die zwischen dem primären Server und den einzelnen Replikaten im Abfragepool synchronisiert werden.

Beim horizontalen Skalieren kann es bis zu fünf Minuten dauern, bis neue Abfragereplikate inkrementell in den Abfragepool aufgenommen werden. Wenn alle neuen Abfragereplikate einsatzbereit sind, kommen für neue Clientverbindungen Ressourcen im Abfragepool für den Lastenausgleich zum Einsatz. Bestehende Clientverbindungen werden nicht geändert; die Verbindung mit der bisherigen Ressource bleibt bestehen. Beim horizontalen Herunterskalieren werden alle bestehenden Clientverbindungen mit einer Abfragepoolressource, die aus dem Abfragepool entfernt wird, beendet. Clients können die Verbindung mit verbleibenden Poolressourcen wiederherstellen.

Funktionsweise

Wenn Sie die Skalierung zum ersten Mal konfigurieren, werden Modelldatenbanken auf Dem primären Server automatisch mit neuen Replikaten in einem neuen Abfragepool synchronisiert. Die automatische Synchronisierung erfolgt nur einmal. Bei der automatischen Synchronisierung werden die Datendateien des (im Ruhezustand im Blobspeicher verschlüsselten) primären Servers an einen zweiten Speicherort kopiert, der ebenfalls im Ruhezustand im Blobspeicher verschlüsselt ist. Replikate im Abfragepool werden dann mit Daten aus dem zweiten Satz von Dateien hydratisiert .

Eine automatische Synchronisierung erfolgt nur, wenn Sie erstmals eine horizontale Skalierung eines Servers ausführen. Sie können jedoch auch eine manuelle Synchronisierung durchführen. Durch die Synchronisierung wird sichergestellt, dass die Daten auf Replikaten im Abfragepool mit den Daten im primären Server übereinstimmen. Beim Verarbeiten (Aktualisieren) von Modellen auf dem primären Server muss eine Synchronisierung ausgeführt werden, nachdem Verarbeitungsvorgänge abgeschlossen wurden. Bei dieser Synchronisierung werden aktualisierte Daten aus den Dateien des primären Servers im Blobspeicher in den zweiten Datensatz kopiert. Replikate im Abfragepool werden dann mit aktualisierten Daten aus dem zweiten Datensatz im Blobspeicher aufgefüllt.

Wenn Sie einen nachfolgenden horizontalen Skalierungsvorgang ausführen und beispielsweise die Anzahl von Replikaten im Abfragepool von zwei auf fünf erhöhen, werden die neuen Replikate mit Daten aus dem zweiten Datensatz im Blobspeicher aktualisiert. Hier erfolgt keine Synchronisierung. Wenn Sie nach dem horizontalen Skalieren eine Synchronisierung durchführen, werden die neuen Replikaten im Abfragepool zweimal aufgefüllt – ein redundanter Vorgang. Bedenken Sie Folgendes, wenn Sie eine nachfolgende horizontale Skalierung durchführen:

Führen Sie eine Synchronisierung vor dem Skalierungsvorgang aus, um redundante Hydratation der hinzugefügten Replikate zu vermeiden. Ein gleichzeitiges Ausführen von Synchronisierung und horizontaler Skalierung ist nicht zulässig.
Beim Automatisieren von Verarbeitungs- und Skalierungsvorgängen ist es wichtig, zuerst Daten auf dem primären Server zu verarbeiten, dann eine Synchronisierung durchzuführen und dann den Skalierungsvorgang auszuführen. So stellen Sie möglichst geringe Auswirkungen auf die Ressourcen in QPU und Arbeitsspeicher sicher.
Während horizontaler Skalierungsvorgänge sind alle Server im Abfragepool, auch der primäre Server, vorübergehend offline.
Die Synchronisierung ist auch dann zulässig, wenn keine Replikate im Abfragepool vorhanden sind. Wenn Sie mit neuen Daten aus einem Verarbeitungsvorgang auf dem primären Server von Null auf ein oder mehrere Replikate hochskalieren, führen Sie zuerst die Synchronisierung ohne Replikate im Abfragepool durch und nehmen Sie dann die horizontale Skalierung vor. Durch das Synchronisieren vor dem horizontalen Skalieren werden redundante Vorgänge mit den neu hinzugefügten Replikaten vermieden.
Wenn Sie eine Modelldatenbank auf dem primären Server löschen, wird sie nicht automatisch aus Replikaten im Abfragepool gelöscht. Sie müssen einen Synchronisierungsvorgang ausführen, indem Sie den PowerShell-Befehl Sync-AzAnalysisServicesInstance verwenden, der die Datei/s für diese Datenbank aus dem freigegebenen Blobspeicherort des Replikats entfernt und dann die Modelldatenbank für die Replikate im Abfragepool löscht. Um festzustellen, ob eine Modelldatenbank für Replikate im Abfragepool vorhanden ist, jedoch nicht auf dem primären Server, stellen Sie sicher, dass die Einstellung Verarbeitungsserver vom Abfragepool trennen auf Ja festgelegt ist. Verwenden Sie dann SQL Server Management Studio (SSMS), um mithilfe des :rw-Qualifizierers eine Verbindung mit dem primären Server herzustellen, um herauszufinden, ob die Datenbank vorhanden ist. Stellen Sie dann eine Verbindung mit Replikaten im Abfragepool her, indem Sie eine Verbindung ohne den :rw-Qualifizierer herstellen, um zu ermitteln, ob die gleiche Datenbank ebenfalls vorhanden ist. Ist die Datenbank auf Replikaten im Abfragepool vorhanden, jedoch nicht auf dem primären Server, führen Sie einen Synchronisierungsvorgang aus.
Wenn Sie eine Datenbank auf dem primären Server umbenennen, ist ein zusätzlicher Schritt erforderlich, um sicherzustellen, dass die Datenbank ordnungsgemäß mit Replikaten synchronisiert wird. Führen Sie nach dem Umbenennen eine Synchronisierung mithilfe des Befehls Sync-AzAnalysisServicesInstance durch, der den -Database Parameter mit dem alten Datenbanknamen angibt. Bei dieser Synchronisierung werden die Datenbank und die Dateien mit dem alten Namen aus Replikate entfernt. Führen Sie eine weitere Synchronisierung durch. Dabei legen Sie den Parameter -Database mit dem alten Datenbanknamen fest. Bei der zweiten Synchronisierung wird die neu benannte Datenbank in den zweiten Datensatz kopiert und alle Replikate aufgefüllt. Diese Synchronisierungen können nicht mithilfe des Befehls „Modell synchronisieren“ im Portal ausgeführt werden.

Synchronisierungsmodus

Standardmäßig werden Abfragereplikate vollständig und nicht inkrementell reaktiviert. Die Reaktivierung erfolgt in Phasen. Es werden jeweils zwei gleichzeitig getrennt und angefügt (sofern mindestens drei Replikate vorhanden sind), um sicherzustellen, dass jederzeit mindestens ein Replikat für Abfragen online ist. In einigen Fällen müssen Clients möglicherweise während der Ausführung dieses Prozesses erneut eine Verbindung mit einem der Onlinereplikate herstellen. Mithilfe der ReplicaSyncMode-Einstellung können Sie jetzt die Abfragereplikatsynchronisierung parallel angeben. Die parallele Synchronisierung bietet folgende Vorteile:

Deutliche Verringerung der Synchronisierungszeit
Daten in unterschiedlichen Replikaten sind während des Synchronisationsvorgang eher konsistent.
Da Datenbanken während des Synchronisierungsprozesses für Replikate online bleiben, müssen Clients keine wiederholte Verbindung herstellen.
Der arbeitsspeicherinterne Cache wird inkrementell nur mit den geänderten Daten aktualisiert. Dies kann schneller erfolgen als eine vollständige Reaktivierung des Modells.

Einstellung „ReplicaSyncMode“

Verwenden Sie SSMS, um ReplicaSyncMode in den erweiterten Eigenschaften festzulegen. Mögliche Werte sind:

1 (Standard): Vollständige Reaktivierung der Replikatdatenbank in Phasen (inkrementell).
2: Parallele Optimierung der Synchronisierung.

ReplicaSyncMode-Einstellung

Beim Festlegen von ReplicaSyncMode=2 kann je nachdem, wie viel Cache aktualisiert werden muss, mehr Arbeitsspeicher von den Abfragereplikaten genutzt werden. Damit die Datenbank online und für Abfragen verfügbar ist, je nachdem, wie viele Daten geändert wurden, kann der Vorgang bis zu doppelter Arbeitsspeicher für das Replikat erforderlich sein, da sowohl die alten als auch die neuen Segmente gleichzeitig im Arbeitsspeicher gespeichert werden. Replikatknoten verfügen über die gleiche Speicherzuordnung wie der primäre Knoten, und in der Regel ist auf dem primären Knoten zusätzlicher Arbeitsspeicher für Aktualisierungsvorgänge verfügbar. Daher ist es unwahrscheinlich, dass für die Replikate nicht genügend Arbeitsspeicher verfügbar ist. Außerdem besteht das gängigste Szenario darin, dass die Datenbank inkrementell auf dem primären Knoten aktualisiert wird, sodass die Anforderung der doppelten Speichermenge nur selten auftreten sollte. Wenn bei der Synchronisierung ein Fehler durch nicht genügend Arbeitsspeicher auftritt, wird der Vorgang mit dem Standardverfahren (Anfügen/Trennen von jeweils zwei Replikaten) erneut ausgeführt.

Getrennte Verarbeitung vom Abfragepool

Zur Optimierung der Leistung bei Verarbeitungs- und Abfragevorgängen können Sie optional Ihren Verarbeitungsserver vom Abfragepool trennen. Nach der Trennung werden neue Clientverbindungen nur den Abfragereplikaten im Abfragepool zugewiesen. Wenn Verarbeitungsvorgänge nur eine kurze Zeit dauern, können Sie Ihren Verarbeitungsserver auch nur für den Zeitraum vom Abfragepool trennen, der zur Durchführung der Verarbeitungs- und Synchronisierungsvorgänge erforderlich ist, und ihn dann wieder in den Abfragepool aufnehmen. Der Vorgang zum Trennen des Verarbeitungsservers vom Abfragepool oder zum erneuten Hinzufügen kann bis zu fünf Minuten dauern.

Überwachen der QPU-Nutzung

Um festzustellen, ob eine Skalierung für Ihren Server erforderlich ist, überwachen Sie Die Servermetriken im Azure-Portal. Wenn regelmäßig die QPU-Obergrenze erreicht wird, übersteigt die Anzahl von Abfragen für Ihre Modelle das QPU-Limit für Ihren Tarif. Die Metrik „Warteschlangenlänge für Abfragepoolaufträge“ erhöht sich auch, wenn die Anzahl von Abfragen in der Warteschlange des Abfragethreadpools die verfügbaren QPUs übersteigt.

Eine weitere gute Metrik zum Überwachen ist die durchschnittliche QPU nach ServerResourceType. Mit dieser Metrik wird die durchschnittliche QPU für den primären Server mit dem Abfragepool verglichen.

Skalierungsmetriken für Abfragen

QPU nach ServerResourceType konfigurieren

Klicken Sie in einem Metrikliniendiagramm auf "Metriken hinzufügen".
Wählen Sie in RESOURCE Ihren Server aus, wählen Sie dann im METRIC NAMESPACEdie Standardmetriken von Analysis Services aus, dann in METRICQPU und schließlich in AGGREGATION die Option Durchschnitt aus.
Klicken Sie auf " Aufteilen anwenden".
Wählen Sie in VALUESden Eintrag "ServerResourceType" aus.

Ausführliche Diagnoseprotokollierung

Verwenden Sie Azure Monitor-Protokolle für eine ausführlichere Diagnose der Serverressourcen mit horizontaler Skalierung. Bei Protokollen können Sie mithilfe von Log Analytics-Abfragen QPU und Arbeitsspeicher nach Server und Replikat unterteilen. Weitere Informationen finden Sie unter Analysieren von Protokollen im Log Analytics-Arbeitsbereich. Beispielabfragen finden Sie unter Beispiel-Kusto-Abfragen.

Konfigurieren der Skalierung nach außen

Im Azure-Portal

Klicken Sie im Portal auf Skalierung. Verwenden Sie den Schieberegler, um die Anzahl der Abfrage-Replikaserver auszuwählen. Die gewählte Anzahl von Replikaten kommt zu Ihrem bereits vorhandenen Server hinzu.
Wählen Sie im Trennen des Verarbeitungsservers vom Abfragepool "Ja" aus, um den Verarbeitungsserver von Abfrageservern auszuschließen. Clientverbindungen mit der Standardverbindungszeichenfolge (ohne:rw) werden an Replikate im Abfragepool umgeleitet.
Klicken Sie auf Speichern, um die neuen Abfragereplikatserver bereitzustellen.

Beim ersten Konfigurieren der horizontalen Skalierung für einen Server werden Modelle auf Ihrem primären Server automatisch mit neuen Replikaten im Abfragepool synchronisiert. Die automatische Synchronisierung erfolgt nur einmal, wenn Sie erstmals die horizontale Skalierung auf ein oder mehrere Replikate konfigurieren. Nachfolgende Änderungen an der Anzahl der Replikate auf demselben Server lösen keine weitere automatische Synchronisierung aus. Die automatische Synchronisierung wird nicht erneut ausgeführt, selbst wenn Sie den Server auf null Replikate festlegen und dann eine horizontale Skalierung auf eine bestimmte Anzahl von Replikaten vornehmen.

Synchronisieren

Synchronisierungsvorgänge müssen manuell oder mithilfe der REST-API ausgeführt werden.

Im Azure-Portal

Im Überblick> Modell>Modell synchronisieren.

Symbol

REST-API

Verwenden Sie den Synchronisierungsvorgang .

Synchronisieren eines Modells

POST https://<region>.asazure.windows.net/servers/<servername>:rw/models/<modelname>/sync

Abrufen des Synchronisierungsstatus

GET https://<region>.asazure.windows.net/servers/<servername>/models/<modelname>/sync

Rückgabestatuscodes:

Programmcode	BESCHREIBUNG
–1	Ungültig
0	Kopierend
1	Aktivierung wird ausgeführt
2	Abgeschlossen
3	gescheitert
4	Beendend

PowerShell

Hinweis

Es wird empfohlen, das Azure Az PowerShell-Modul für die Interaktion mit Azure zu verwenden. Informationen zu den ersten Schritten finden Sie unter Installieren von Azure PowerShell. Informationen zum Migrieren zum Az PowerShell-Modul finden Sie unter Migrieren von Azure PowerShell von AzureRM zu Az.

Bevor Sie PowerShell verwenden, installieren oder aktualisieren Sie das neueste Azure PowerShell-Modul.

Um die Synchronisierung auszuführen, verwenden Sie Sync-AzAnalysisServicesInstance.

Verwenden Sie "Set-AzAnalysisServicesServer", um die Anzahl der Abfragereplikate festzulegen. Geben Sie den optionalen Parameter -ReadonlyReplicaCount an.

Verwenden Sie "Set-AzAnalysisServicesServer", um den Verarbeitungsserver vom Abfragepool zu trennen. Geben Sie den optionalen Parameter -DefaultConnectionMode an, um Readonly zu verwenden.

Weitere Informationen finden Sie unter Verwenden eines Dienstprinzipals mit dem Az.AnalysisServices-Modul.

Verbindungen

Auf der Übersichtsseite des Servers werden zwei Servernamen angezeigt. Wenn Sie noch keine horizontale Hochskalierung für einen Server konfiguriert haben, funktionieren beide Servernamen gleich. Nach dem Konfigurieren der horizontalen Hochskalierung für einen Server müssen Sie den passenden Servernamen für den jeweiligen Verbindungstyp angeben.

Verwenden Sie für Endbenutzerclientverbindungen wie Power BI Desktop, Excel und benutzerdefinierte Apps den Servernamen.

Verwenden Sie für SSMS-, Visual Studio- und Verbindungszeichenfolgen in PowerShell, Azure Function-Apps und AMO den Namen des Verwaltungsservers. Der Name des Verwaltungsservers enthält einen speziellen :rw-Qualifizierer (Lesen/Schreiben). Sämtliche Verarbeitungsvorgänge finden auf dem (primären) Verwaltungsserver statt.

Servernamen

Zentrales Hochskalieren, zentrales Herunterskalieren oder Horizontales Skalieren

Sie können den Tarif auf einem Server mit mehreren Replikaten ändern. Der gleiche Tarif gilt für alle Replikate. Bei einem Skalierungsvorgang werden zunächst alle Replikate gleichzeitig heruntergefahren und dann mit dem neuen Tarif gestartet.

Fehlersuche

Problem: Benutzer erhalten den Fehler "Kann die Server '<Name der Server>' Instanz im Verbindungsmodus 'ReadOnly' nicht finden."

Lösung: Wenn Sie den Verarbeitungsserver von der Abfragepooloption trennen , werden Clientverbindungen mit der Standardverbindungszeichenfolge (ohne :rw) an Abfragepoolreplikate umgeleitet. Wenn Replikate im Abfragepool noch nicht online sind, weil die Synchronisierung noch nicht abgeschlossen ist, können umgeleitete Clientverbindungen fehlschlagen. Um Verbindungsfehler zu verhindern, müssen beim Durchführen einer Synchronisierung mindestens zwei Server im Abfragepool enthalten sein. Jeder Server wird einzeln synchronisiert, während andere Server online bleiben. Wenn der Verarbeitungsserver während der Verarbeitung nicht im Abfragepool enthalten sein soll, können Sie ihn für die Verarbeitung aus dem Pool entfernen und dann nach Abschluss der Verarbeitung, jedoch vor der Synchronisierung, wieder zum Pool hinzufügen. Verwenden Sie die Metriken „Arbeitsspeicher“ und „QPU“, um den Synchronisierungsstatus zu überwachen.

Überwachen von Azure Analysis Services Verwalten von Azure Analysis Services

Freigeben über

Horizontales Hochskalieren von Azure Analysis Services

Gründe für die Aufskalierung

Funktionsweise

Synchronisierungsmodus

Einstellung „ReplicaSyncMode“

Getrennte Verarbeitung vom Abfragepool

Überwachen der QPU-Nutzung

Ausführliche Diagnoseprotokollierung

Konfigurieren der Skalierung nach außen

Im Azure-Portal

Synchronisieren

Im Azure-Portal

REST-API

Synchronisieren eines Modells

Abrufen des Synchronisierungsstatus

PowerShell

Verbindungen

Zentrales Hochskalieren, zentrales Herunterskalieren oder Horizontales Skalieren

Fehlersuche

Verwandte Informationen

Feedback

Zusätzliche Ressourcen