Freigeben über


Leitfaden zur Leistungsoptimierung für den serverlosen SQL-Pool von Azure Synapse Analytics

Gilt für: Azure Synapse Analytics

Dieser Artikel hilft Ihnen, die Leistung für Azure Synapse Analytics serverlosen SQL-Pool zu verbessern.

Hinweis

Überprüfen Sie die Liste der bekannten Probleme, die derzeit aktiv oder kürzlich in Azure Synapse Analytics behoben wurden.

In den nächsten Abschnitten finden Sie Informationen dazu, wie Sie eine optimale Leistung erzielen und Fehler im Zusammenhang mit Ressourceneinschränkungen für Ihre serverlosen Azure Synapse Analytics-SQL-Pools verhindern.

Best Practices und Leitfäden zur Problembehandlung

Die Informationen und Strategien in den folgenden Artikeln können Ihnen helfen, die beste Leistung aus Ihrem serverlosen SQL-Pool zu erzielen. Es wird empfohlen, diese Artikel zu verwenden, um Anwendungsfälle zu überprüfen und häufige Probleme zu beheben.

Grundlegendes zur Skalierung im serverlosen SQL-Pool

Serverlose SQL-Pools erfordern nicht, dass Sie die richtige Größe manuell auswählen. Das System passt die Größe automatisch an Ihre Abfrageanforderungen an und verwaltet dadurch die Infrastruktur und wählt die richtige Größe für Ihre Lösung aus.

Leitfaden zur Leistungsoptimierung für Delta Lake-Dateien

Weitere Informationen zur Leistungsoptimierung für Delta Lake-Dateien finden Sie in den folgenden Ressourcen:

Leitfaden zur Leistungsoptimierung für CSV-Dateien

Wenn Sie CSV-Dateien in einem serverlosen SQL-Pool abfragen, besteht die wichtigste Aufgabe, um eine hohe Leistung sicherzustellen, darin, Statistiken für die externen Tabellen zu erstellen. Statistiken werden zwar automatisch für Parquet- und CSV-Dateien erstellt und mithilfe OPENQUERY()von aufgerufen, zum Lesen der CSV-Dateien mithilfe externer Tabellen müssen Sie statistiken manuell erstellen.

Ausführlichere Informationen zur Rolle von Statistiken beim Abfragen von CSV-Dateien in serverlosen SQL-Pools finden Sie in den folgenden Artikeln:

Empfehlungen für die Verwendung von Power BI und anderen Berichterstellungstools

Wir empfehlen die folgenden bewährten Methoden, wenn Sie Power BI und andere Berichterstellungstools verwenden:

  • Überprüfen Sie immer Ihren Mandantenstandort.
  • Richten Sie einen Cache für eine bessere Benutzererfahrung ein.
  • Vermeiden Sie die Rückgabe von Millionen von Datensätzen an eine Dashboard.
  • Verwenden Sie geplante Aktualisierungen, um parallele Abfrageausführungen zu vermeiden, die Ressourcen des serverlosen SQL-Pools ausgleichen.
  • Verwenden Sie Spark, um allgemeine analytische Abfragen vorab zu aggregieren. Dieser Ansatz zum Schreiben von Einmal-/Lesevorgängen kann umfangreiche Abfragen vermeiden, die kontinuierlich ausgeführt werden.
  • Für Verknüpfungen zwischen verschiedenen Datenspeichern: Verwenden Sie Filter, um Big Data-Volumes zu vermeiden, die in Ihre Azure-Infrastruktur verschoben wurden.
  • Verwenden Sie Latin1_General_100_BIN2_UTF8 die Sortierung für Zeichendatentypen. Durch diese Sortierung wird vermieden, dass alle Daten aus dem Speicher in Ihren serverlosen SQL-Pool übertragen werden, indem Filter gepusht werden, wenn Tools aus dem Speicher lesen.
  • Verwenden Sie die optimale Größe, wenn Sie Daten während der Ausführung einer Abfrage in char oder varchar konvertieren. Vermeiden Sie nach Möglichkeit die Verwendung von VARCHAR(MAX).
  • Der automatische Rückschluss konvertiert Datentypen in ein Format, das möglicherweise nicht optimal ist. Verwenden Sie die WITH -Klausel, um Datentypen zu optimieren.
  • Für Azure Synapse Ressourcen des serverlosen SQL-Pools gelten Grenzwerte. Das gleichzeitige Ausführen von Abfragen verbraucht Ressourcen. Es ist üblich, dass Power BI-Dashboards (PBI) ressourcenlimits erreichen, wenn mehrere Aktualisierungen parallel erfolgen. Geplante Aktualisierungen und Auslastungstests können dazu beitragen, dieses Problem zu vermeiden. Darüber hinaus kann die Verwendung mehrerer Azure Synapse Arbeitsbereiche höhere Parallelitätsanforderungen erfüllen.
  • Sie können die Abfrage sys.columns ausführen oder und select top 0 from <view> verwendensp_describe_first_result_set, um die Datentypen zu überprüfen, nachdem Sie eine Ansicht erstellt haben. Dieser Ansatz ist schneller und kostengünstiger als die Verwendung von SELECT * FROM....
  • Verwenden Sie den Anweisungsgenerator , um automatisch optimale Spaltenformate für Ihre Abfrage zu erstellen.
  • Verwenden Sie die OPENJSON -Funktion, um geschachtelte JSON-Daten als Spalten verfügbar zu machen. Wenn Sie jedoch auch den AS JSON Befehl verwenden, muss der Spaltentyp sein NVARCHAR(MAX). Dieser Ansatz ist nicht ideal für die Leistung. Die beste Option besteht darin, die WITH -Klausel zu verwenden, um geschachtelte Arrays als Spalten verfügbar zu machen.
  • Der Partitionsschlüssel des Cosmos DB-Transaktionsspeichers wird im Analysespeicher nicht verwendet. In Azure Synapse Link können Sie jetzt Ihre Transaktionsdaten modellieren, um die Datenerfassung und Punktlesevorgänge zu optimieren.

Zusätzliche Anleitungen und bewährte Methoden

Kategorie Empfohlene Aktionen oder Dokumentation
Datenuntersuchung Azure Storage
Speichern von Abfrageergebnissen in Azure Storage
Logisches Data Warehouse
OPENROWSET und externe Tabellen OPENROWSET-Funktion
Externe Tabellen
Gespeicherte Prozeduren
Ansichten
Datentransformationen
Verfügbare T-SQL-Features in serverlosen SQL-Pools T-SQL-Features in Azure Synapse Pools

Informationen zum Haftungsausschluss von Drittanbietern

Die in diesem Artikel genannten Drittanbieterprodukte stammen von Herstellern, die von Microsoft unabhängig sind. Microsoft gewährt keine implizite oder sonstige Garantie in Bezug auf die Leistung oder Zuverlässigkeit dieser Produkte.