Anleitung zur Leistungsoptimierung für den serverlosen SQL-Pool von Azure Synapse Analytics

Gilt für: Azure Synapse Analytics

Dieser Artikel hilft Ihnen, die Leistung für den serverlosen SQL-Pool von Azure Synapse Analytics zu verbessern.

Notiz

Überprüfen Sie die Liste der bekannten Probleme , die derzeit aktiv oder kürzlich in Azure Synapse Analytics behoben sind.

In den nächsten Abschnitten finden Sie Informationen dazu, wie Sie eine optimale Leistung erzielen und Fehler verhindern können, die sich auf Ressourceneinschränkungen in Ihren Serverlosen SQL-Pools von Azure Synapse Analytics beziehen.

Bewährte Methoden und Anleitungen zur Problembehandlung

Die Informationen und Strategien in den folgenden Artikeln können Ihnen helfen, die beste Leistung aus Ihrem serverlosen SQL-Pool zu erzielen. Es wird empfohlen, diese Artikel zu verwenden, um Anwendungsfälle zu überprüfen und häufige Probleme zu beheben.

Grundlegendes zur Skalierung auf serverlosen SQL-Pool

Serverlose SQL-Pools erfordern nicht, dass Sie manuell die richtige Größe auswählen. Das System passt die Größe automatisch basierend auf Ihren Abfrageanforderungen an und verwaltet dadurch die Infrastruktur und wählt die richtige Größe für Ihre Lösung aus.

Anleitung zur Leistungsoptimierung für Delta Lake-Dateien

Weitere Informationen zur Leistungsoptimierung für Delta Lake-Dateien finden Sie in den folgenden Ressourcen:

Leitfaden zur Leistungsoptimierung für CSV-Dateien

Wenn Sie CSV-Dateien in einem serverlosen SQL-Pool abfragen, ist die wichtigste Aufgabe, um sicherzustellen, dass hohe Leistung Statistiken zu den externen Tabellen erstellt. Statistiken werden zwar automatisch für Parkett- und CSV-Dateien erstellt und mithilfe der OPENQUERY()Verwendung darauf zugegriffen, aber das Lesen der CSV-Dateien mithilfe externer Tabellen erfordert, dass Sie manuell Statistiken erstellen.

Ausführlichere Informationen zur Rolle von Statistiken beim Abfragen von CSV-Dateien in serverlosen SQL-Pools finden Sie in den folgenden Artikeln:

Empfehlungen für die Verwendung von Power BI und anderen Berichterstellungstools

Wir empfehlen die folgenden bewährten Methoden, wenn Sie Power BI und andere Berichterstellungstools verwenden:

Überprüfen Sie stets den Standort Ihres Mandanten.
Richten Sie einen Cache ein, um die Benutzerfreundlichkeit zu erhöhen.
Geben Sie nach Möglichkeit nicht mehrere Millionen Datensätze an ein Dashboard zurück.
Verwenden Sie geplante Aktualisierungen, um parallele Abfrageausführungen zu vermeiden, die SQL Serverless-Poolressourcen entwässern.
Verwenden Sie Spark, um allgemeine analysebasierte Abfragen vorab zu aggregieren. Dieser Ansatz zum Schreiben von Einmal-/Lesevorgängen kann schwere Abfragen vermeiden, die kontinuierlich ausgeführt werden.
Für Verknüpfungen zwischen verschiedenen Datenspeichern: Verwenden Sie Filter, um Große Datenvolumes zu vermeiden, die in Ihre Azure-Infrastruktur verschoben wurden.
Verwenden Sie Latin1_General_100_BIN2_UTF8 die Sortierung für Zeichendatentypen. Durch diese Sortierung wird verhindert, dass alle Daten vom Speicher in den serverlosen SQL-Pool übertragen werden, indem Filter gedrückt werden, wenn Tools aus dem Speicher gelesen werden.
Verwenden Sie die optimale Größe, wenn Sie Daten char umwandeln oder in oder varchar während der Ausführung einer Abfrage konvertieren. Wenn möglich, vermeiden Sie die Verwendung von VARCHAR(MAX).
Die automatische Ableitung konvertiert Datentypen in ein Format, das möglicherweise nicht optimal ist. Verwenden Sie die WITH-Klausel zur Optimierung von Datentypen.
Die Azure Synapse SQL Serverless-Poolressourcen weisen Beschränkungen auf. Das gleichzeitige Ausführen von Abfragen verbraucht Ressourcen. Es ist üblich, dass Power BI-Dashboards (PBI) ressourcenlimits erreichen, wenn mehrere Aktualisierungen parallel auftreten. Geplante Aktualisierungen und Auslastungstests können dazu beitragen, dieses Problem zu vermeiden. Außerdem kann die Verwendung mehrerer Azure Synapse-Arbeitsbereiche größere Parallelitätsanforderungen erfüllen.
Sie können die Abfrage sys.columns ausführen oder verwenden sp_describe_first_result_set und select top 0 from <view> die Datentypen überprüfen, nachdem Sie eine Ansicht erstellt haben. Dieser Ansatz ist schneller und kostengünstiger als die Verwendung SELECT * FROM....
Verwenden Sie den Statement Generator , um automatisch optimale Spaltenformate für Ihre Abfrage zu erstellen.
Verwenden Sie die OPENJSON Funktion, um geschachtelte JSON-Daten als Spalten verfügbar zu machen. Wenn Sie aber auch den AS JSON Befehl verwenden, muss der Spaltentyp sein NVARCHAR(MAX). Dieser Ansatz ist nicht ideal für die Leistung. Die beste Option ist die Verwendung der WITH Klausel, um verschachtelte Arrays als Spalten darzustellen.
Der Partitionsschlüssel des Cosmos DB-Transaktionsspeichers wird nicht im Analytischen Speicher verwendet. In Azure Synapse Link können Sie Ihre Transaktionsdaten jetzt modellieren, um die Datenerfassung und Punktlesevorgänge zu optimieren.

Zusätzliche Anleitungen und bewährte Methoden

Kategorie	Empfohlene Aktionen oder Dokumentation
Durchsuchen von Daten	Azure Storage Speichern von Abfrageergebnissen in Azure-Speicher Logisches Data Warehouse
OPENROWSET und externe Tabellen	OPENROWSET-Funktion Externe Tabellen Gespeicherte Prozeduren Ansichten Datentransformationen
Verfügbare T-SQL-Features in serverlosen SQL-Pools	T-SQL-Features in Azure Synapse-Pools

Informationen zum Haftungsausschluss von Drittanbietern

Die in diesem Artikel genannten Drittanbieterprodukte stammen von Herstellern, die von Microsoft unabhängig sind. Microsoft gewährt keine implizite oder sonstige Garantie in Bezug auf die Leistung oder Zuverlässigkeit dieser Produkte.

Feedback

War diese Seite hilfreich?

Last updated on 2024-11-20