Synchronisieren von Apache Spark für externe Azure Synapse-Tabellendefinitionen im serverlosen SQL-Pool

Tip

Microsoft Fabric Data Warehouse ist ein relationales Enterprise-Warehouse auf einem Data Lake-Fundament mit zukunftsfähiger Architektur, integrierter KI und neuen Features. Wenn Sie mit Data Warehouse noch nicht vertraut sind, beginnen Sie mit Fabric Data Warehouse. Vorhandene dedizierte SQL-Pool-Workloads können auf Fabric aktualisieren, um neue Funktionen in den Bereichen Data Science, Echtzeitanalyse und Berichterstellung zu nutzen.

Der Serverlose SQL-Pool kann Metadaten von Apache Spark automatisch synchronisieren. Für jede Datenbank, die in serverlosen Apache Spark-Pools vorhanden ist, wird eine serverlose SQL-Pooldatenbank erstellt.

Für jede externe Spark-Tabelle, die auf Parkett oder CSV basiert und sich in Azure Storage befindet, wird eine externe Tabelle in einer serverlosen SQL-Pooldatenbank erstellt. So können Sie Ihre Spark-Pools herunterfahren und dennoch Spark-externe Tabellen aus serverlosen SQL-Pool abfragen.

Wenn eine Tabelle in Spark partitioniert wird, werden Dateien im Speicher nach Ordnern organisiert. Der Serverlose SQL-Pool verwendet Partitionsmetadaten und nur relevante Ordner und Dateien für Ihre Abfrage.

Die Metadatensynchronisierung wird automatisch für jeden serverlosen Apache Spark-Pool konfiguriert, der im Azure Synapse-Arbeitsbereich bereitgestellt wird. Sie können sofort mit der Abfrage externer Spark-Tabellen beginnen.

Jede externe Spark-Parkett- oder CSV-Tabelle, die sich in Azure Storage befindet, wird mit einer externen Tabelle in einem dbo-Schema dargestellt, das einer serverlosen SQL-Pooldatenbank entspricht.

Führen Sie eine Abfrage aus, die auf eine externe Spark-Tabelle abzielt. Stellen Sie vor dem Ausführen des folgenden Beispiels sicher, dass Sie korrekten Zugriff auf das Speicherkonto haben, auf das sich die Dateien befinden.

SELECT * FROM [db].dbo.[spark_table]

Apache Spark-Datentypen zur SQL-Datentypenzuordnung

Weitere Informationen zum Zuordnen von Apache Spark-Datentypen zu SQL-Datentypen finden Sie unter Azure Synapse Analytics freigegebene Metadatentabellen.

Nächste Schritte

Wechseln Sie zum Artikel Storage Access Control, um mehr über Speicherzugriffskontrolle zu erfahren.

Feedback

War diese Seite hilfreich?

Last updated on 2026-05-03

Synchronisieren von Apache Spark für externe Azure Synapse-Tabellendefinitionen im serverlosen SQL-Pool

Apache Spark-Datentypen zur SQL-Datentypenzuordnung

Nächste Schritte

Feedback

Zusätzliche Ressourcen