Synchronizace definic externích tabulek Apache Spark pro Azure Synapse v bezserverovém fondu SQL

Bezserverový fond SQL může automaticky synchronizovat metadata z Apache Sparku. Pro každou databázi existující v bezserverových fondech Apache Sparku se vytvoří bezserverová databáze fondu SQL.

Pro každou externí tabulku Sparku založenou na Parquet nebo CSV a umístěnou ve službě Azure Storage se vytvoří externí tabulka v bezserverové databázi fondu SQL. Proto můžete fondy Sparku vypnout a dál dotazovat externí tabulky Sparku z bezserverového fondu SQL.

Při dělení tabulky ve Sparku jsou soubory v úložišti uspořádané podle složek. Bezserverový fond SQL bude používat metadata oddílů a cílit pouze na relevantní složky a soubory pro váš dotaz.

Synchronizace metadat se automaticky konfiguruje pro každý bezserverový fond Apache Spark zřízený v pracovním prostoru Azure Synapse. Externí tabulky Sparku můžete začít dotazovat okamžitě.

Každá externí tabulka Spark Parquet nebo CSV umístěná ve službě Azure Storage je reprezentována externí tabulkou ve schématu dbo, která odpovídá bezserverové databázi fondu SQL.

Pro dotazy externí tabulky Sparku spusťte dotaz, který cílí na externí [spark_table]. Před spuštěním následujícího příkladu se ujistěte, že máte správný přístup k účtu úložiště , ve kterém jsou umístěné soubory.

SELECT * FROM [db].dbo.[spark_table]

Mapování datových typů Apache Sparku na datové typy SQL

Další informace o mapování datových typů Apache Sparku na datové typy SQL najdete v tématu Sdílené tabulky metadat služby Azure Synapse Analytics.

Další kroky

Další informace o řízení přístupu k úložišti najdete v článku Řízení přístupu k úložišti.