Bagikan melalui


Azure Synapse Analytics shared metadata

Azure Synapse Analytics memungkinkan mesin komputasi ruang kerja yang berbeda untuk berbagi database dan tabel antara kumpulan Apache Spark dan kumpulan SQL tanpa server.

Fitur berbagi mendukung pola yang disebut sebagai "data warehouse modern" dan memberikan mesin SQL di dalam ruang kerja akses ke basis data dan tabel yang dibuat menggunakan Spark. Hal ini juga memungkinkan mesin SQL untuk membuat objek mereka sendiri yang tidak dibagikan dengan mesin lain.

Support the modern data warehouse

Model metadata bersama mendukung pola gudang data modern dengan cara berikut:

  1. Data from the data lake is prepared and structured efficiently with Spark by storing the prepared data in (possibly partitioned) Parquet-backed tables contained in possibly several databases.

  2. Database yang dibuat oleh Spark dan semua tabelnya menjadi terlihat pada instance kumpulan Spark di ruang kerja Azure Synapse manapun dan dapat digunakan dalam pekerjaan Spark manapun. Kemampuan ini tunduk pada izin karena semua kumpulan Spark di ruang kerja berbagi penyimpanan meta katalog yang mendasar yang sama.

  3. The Spark created databases and their Parquet-backed or CSV-backed tables become visible in the workspace serverless SQL pool. Database dibuat secara otomatis dalam metadata kumpulan SQL tanpa server, dan tabel eksternal dan terkelola yang dibuat oleh pekerjaan Spark dapat diakses sebagai tabel eksternal dalam metadata kumpulan SQL tanpa server dalam dbo skema database yang sesuai.

Sinkronisasi objek terjadi secara asinkron. Objek akan memiliki sedikit penundaan beberapa detik sampai muncul dalam konteks SQL. Setelah muncul, mereka dapat dikueri, tetapi tidak diperbarui atau diubah oleh mesin SQL yang memiliki akses ke mereka.

Objek metadata bersama

Spark memungkinkan Anda membuat database, tabel eksternal, tabel terkelola, dan tampilan. Since Spark views require a Spark engine to process the defining Spark SQL statement, and cannot be processed by a SQL engine, only databases and their contained external and managed tables that use the Parquet or CSV storage format are shared with the workspace SQL engine. Tampilan Spark hanya dibagikan di antara instans kumpulan Spark.

Sekilas model keamanan

Database dan tabel Spark, bersama dengan representasi yang disinkronkan di mesin SQL, diamankan pada tingkat penyimpanan yang mendasar. Ketika tabel dikueri oleh salah satu mesin yang berhak digunakan oleh pengirim kueri, prinsip keamanan pengirim kueri sedang diteruskan ke file yang mendasar. Permissions are checked at the file system level.

Untuk informasi selengkapnya, lihat Basis Data Bersama Azure Synapse Analytics.

Change maintenance

Jika objek metadata dihapus atau diubah dengan Spark, perubahan diambil dan disebarkan ke kumpulan SQL tanpa server. Sinkronisasi tidak sinkron dan perubahan tercermin dalam mesin SQL setelah penundaan singkat.

Langkah berikutnya