Sdílet prostřednictvím


Sdílená metadata služby Azure Synapse Analytics

Azure Synapse Analytics umožňuje různým výpočetním modulům pracovního prostoru sdílet databáze a tabulky mezi fondy Apache Sparku a bezserverovým fondem SQL.

Sdílení podporuje takzvaný model moderního datového skladu a poskytuje modulům SQL pracovního prostoru přístup k databázím a tabulkám vytvořeným pomocí Sparku. Umožňuje také modulům SQL vytvářet vlastní objekty, které se nesdílejí s ostatními moduly.

Podpora moderního datového skladu

Model sdílených metadat podporuje moderní model datového skladu následujícím způsobem:

  1. Data z datového jezera jsou efektivně připravena a strukturována pomocí Spark tím, že se uloží připravená data do tabulek Parquet, které jsou možná rozdělené a jsou součástí několika databází.

  2. Vytvořené databáze Sparku a všechny jejich tabulky se zviditelní v libovolné instanci fondu Sparku pracovního prostoru Azure Synapse a dají se použít z libovolné úlohy Sparku. Tato funkce podléhá oprávněním , protože všechny fondy Sparku v pracovním prostoru sdílejí stejné základní úložiště metadat katalogu.

  3. Databáze vytvořené Sparkem a jejich tabulky s podporou Parquet nebo CSV se zobrazí v bezserverovém fondu SQL pracovního prostoru. Databáze se automaticky vytvářejí v metadatech bezserverového fondu SQL a externí a spravované tabulky vytvořené úlohou Sparku jsou přístupné jako externí tabulky v metadatech bezserverového fondu SQL v dbo schématu odpovídající databáze.

Synchronizace objektů probíhá asynchronně. Objekty budou mít mírné zpoždění o několik sekund, dokud se nezobrazí v kontextu SQL. Jakmile se zobrazí, lze je dotazovat, ale SQL stroje, které k nim mají přístup, je nemohou aktualizovat ani měnit.

Sdílené objekty metadat

Spark umožňuje vytvářet databáze, externí tabulky, spravované tabulky a zobrazení. Vzhledem k tomu, že zobrazení Sparku vyžadují, aby modul Spark zpracovával definování příkazu Spark SQL a nelze je zpracovat pomocí modulu SQL, sdílí se s pracovním modulem SQL pouze databáze a jejich obsažené externí a spravované tabulky, které používají formát úložiště Parquet nebo CSV. Zobrazení Sparku jsou sdílena pouze mezi instancemi fondu Sparku.

Model zabezpečení na první pohled

Databáze a tabulky Sparku spolu s jejich synchronizovanými reprezentacemi v modulu SQL jsou zabezpečené na základní úrovni úložiště. Když se na tabulku dotazuje některý ze strojů, které má odesilatel dotazu právo použít, předává se bezpečnostní identita odesilatele dotazu zásadním souborům. Oprávnění se kontrolují na úrovni systému souborů.

Další informace najdete v části sdílené databáze Azure Synapse Analytics.

Změna údržby

Pokud se pomocí Sparku odstraní nebo změní objekt metadat, změny se vyberou a rozšíří do bezserverového fondu SQL. Synchronizace je asynchronní a změny se projeví v modulu SQL po krátké prodlevě.

Další kroky