Leitfaden zur Leistungsoptimierung für den serverlosen SQL-Pool von Azure Synapse Analytics
Gilt für: Azure Synapse Analytics
Dieser Artikel hilft Ihnen, die Leistung für Azure Synapse Analytics serverlosen SQL-Pool zu verbessern.
Hinweis
Überprüfen Sie die Liste der bekannten Probleme, die derzeit aktiv oder kürzlich in Azure Synapse Analytics behoben wurden.
In den nächsten Abschnitten finden Sie Informationen dazu, wie Sie eine optimale Leistung erzielen und Fehler im Zusammenhang mit Ressourceneinschränkungen für Ihre serverlosen Azure Synapse Analytics-SQL-Pools verhindern.
Best Practices und Leitfäden zur Problembehandlung
Die Informationen und Strategien in den folgenden Artikeln können Ihnen helfen, die beste Leistung aus Ihrem serverlosen SQL-Pool zu erzielen. Es wird empfohlen, diese Artikel zu verwenden, um Anwendungsfälle zu überprüfen und häufige Probleme zu beheben.
- Bewährte Methoden für serverlose SQL-Pools in Azure Synapse Analytics
- Problembehandlung für serverlose SQL-Pools in Azure Synapse Analytics
Grundlegendes zur Skalierung im serverlosen SQL-Pool
Serverlose SQL-Pools erfordern nicht, dass Sie die richtige Größe manuell auswählen. Das System passt die Größe automatisch an Ihre Abfrageanforderungen an und verwaltet dadurch die Infrastruktur und wählt die richtige Größe für Ihre Lösung aus.
Leitfaden zur Leistungsoptimierung für Delta Lake-Dateien
Weitere Informationen zur Leistungsoptimierung für Delta Lake-Dateien finden Sie in den folgenden Ressourcen:
- Delta Lake-Dokumentationsseite.
- Was ist Delta Lake?
- Abfragen von Delta Lake-Dateien mithilfe eines serverlosen SQL-Pools in Azure Synapse Analytics
Leitfaden zur Leistungsoptimierung für CSV-Dateien
Wenn Sie CSV-Dateien in einem serverlosen SQL-Pool abfragen, besteht die wichtigste Aufgabe, um eine hohe Leistung sicherzustellen, darin, Statistiken für die externen Tabellen zu erstellen. Statistiken werden zwar automatisch für Parquet- und CSV-Dateien erstellt und mithilfe OPENQUERY()
von aufgerufen, zum Lesen der CSV-Dateien mithilfe externer Tabellen müssen Sie statistiken manuell erstellen.
Ausführlichere Informationen zur Rolle von Statistiken beim Abfragen von CSV-Dateien in serverlosen SQL-Pools finden Sie in den folgenden Artikeln:
- Abfragen von CSV-Dateien
- Statistiken im serverlosen SQL-Pool
- Manuelles Erstellen von Statistiken für CSV-Dateien
- Abfragetimeout abgelaufen
Empfehlungen für die Verwendung von Power BI und anderen Berichterstellungstools
Wir empfehlen die folgenden bewährten Methoden, wenn Sie Power BI und andere Berichterstellungstools verwenden:
- Überprüfen Sie immer Ihren Mandantenstandort.
- Richten Sie einen Cache für eine bessere Benutzererfahrung ein.
- Vermeiden Sie die Rückgabe von Millionen von Datensätzen an eine Dashboard.
- Verwenden Sie geplante Aktualisierungen, um parallele Abfrageausführungen zu vermeiden, die Ressourcen des serverlosen SQL-Pools ausgleichen.
- Verwenden Sie Spark, um allgemeine analytische Abfragen vorab zu aggregieren. Dieser Ansatz zum Schreiben von Einmal-/Lesevorgängen kann umfangreiche Abfragen vermeiden, die kontinuierlich ausgeführt werden.
- Für Verknüpfungen zwischen verschiedenen Datenspeichern: Verwenden Sie Filter, um Big Data-Volumes zu vermeiden, die in Ihre Azure-Infrastruktur verschoben wurden.
- Verwenden Sie
Latin1_General_100_BIN2_UTF8
die Sortierung für Zeichendatentypen. Durch diese Sortierung wird vermieden, dass alle Daten aus dem Speicher in Ihren serverlosen SQL-Pool übertragen werden, indem Filter gepusht werden, wenn Tools aus dem Speicher lesen. - Verwenden Sie die optimale Größe, wenn Sie Daten während der Ausführung einer Abfrage in
char
odervarchar
konvertieren. Vermeiden Sie nach Möglichkeit die Verwendung vonVARCHAR(MAX)
. - Der automatische Rückschluss konvertiert Datentypen in ein Format, das möglicherweise nicht optimal ist. Verwenden Sie die
WITH
-Klausel, um Datentypen zu optimieren. - Für Azure Synapse Ressourcen des serverlosen SQL-Pools gelten Grenzwerte. Das gleichzeitige Ausführen von Abfragen verbraucht Ressourcen. Es ist üblich, dass Power BI-Dashboards (PBI) ressourcenlimits erreichen, wenn mehrere Aktualisierungen parallel erfolgen. Geplante Aktualisierungen und Auslastungstests können dazu beitragen, dieses Problem zu vermeiden. Darüber hinaus kann die Verwendung mehrerer Azure Synapse Arbeitsbereiche höhere Parallelitätsanforderungen erfüllen.
- Sie können die Abfrage
sys.columns
ausführen oder undselect top 0 from <view>
verwendensp_describe_first_result_set
, um die Datentypen zu überprüfen, nachdem Sie eine Ansicht erstellt haben. Dieser Ansatz ist schneller und kostengünstiger als die Verwendung vonSELECT * FROM...
. - Verwenden Sie den Anweisungsgenerator , um automatisch optimale Spaltenformate für Ihre Abfrage zu erstellen.
- Verwenden Sie die
OPENJSON
-Funktion, um geschachtelte JSON-Daten als Spalten verfügbar zu machen. Wenn Sie jedoch auch denAS JSON
Befehl verwenden, muss der Spaltentyp seinNVARCHAR(MAX)
. Dieser Ansatz ist nicht ideal für die Leistung. Die beste Option besteht darin, dieWITH
-Klausel zu verwenden, um geschachtelte Arrays als Spalten verfügbar zu machen. - Der Partitionsschlüssel des Cosmos DB-Transaktionsspeichers wird im Analysespeicher nicht verwendet. In Azure Synapse Link können Sie jetzt Ihre Transaktionsdaten modellieren, um die Datenerfassung und Punktlesevorgänge zu optimieren.
Zusätzliche Anleitungen und bewährte Methoden
Kategorie | Empfohlene Aktionen oder Dokumentation |
---|---|
Datenuntersuchung | Azure Storage Speichern von Abfrageergebnissen in Azure Storage Logisches Data Warehouse |
OPENROWSET und externe Tabellen | OPENROWSET-Funktion Externe Tabellen Gespeicherte Prozeduren Ansichten Datentransformationen |
Verfügbare T-SQL-Features in serverlosen SQL-Pools | T-SQL-Features in Azure Synapse Pools |
Informationen zum Haftungsausschluss von Drittanbietern
Die in diesem Artikel genannten Drittanbieterprodukte stammen von Herstellern, die von Microsoft unabhängig sind. Microsoft gewährt keine implizite oder sonstige Garantie in Bezug auf die Leistung oder Zuverlässigkeit dieser Produkte.
Feedback
https://aka.ms/ContentUserFeedback.
Bald verfügbar: Im Laufe des Jahres 2024 werden wir GitHub-Issues stufenweise als Feedbackmechanismus für Inhalte abbauen und durch ein neues Feedbacksystem ersetzen. Weitere Informationen finden Sie unterFeedback senden und anzeigen für