Menggunakan Azure Synapse Analytics dengan analitik skala cloud

Artikel
10/07/2023

Azure Synapse Analytics adalah layanan analitik terintegrasi yang mempercepat waktu untuk mendapatkan wawasan di seluruh gudang data dan sistem big data. Azure Synapse Analytics menyatukan:

Teknologi SQL terbaik yang digunakan dalam pergudangan data perusahaan.
Teknologi Spark digunakan untuk big data.
Alur untuk aplikasi data (selaras sumber) dan mengekstrak, mengubah, dan memuat (ETL) atau mengekstrak, memuat, dan mengubah (ELT).

Azure Synapse studio adalah alat di Azure Synapse yang memberikan pengalaman terpadu untuk manajemen, pemantauan, pengodean, dan keamanan. Synapse studio memiliki integrasi mendalam dengan layanan Azure lainnya seperti Power BI, Azure Cosmos DB, dan Azure Machine Learning.

Catatan

Bagian ini bertujuan untuk menjelaskan konfigurasi yang ditentukan yang khusus untuk analitik skala cloud. Ini adalah pujian untuk dokumentasi Azure Synapse Analytics resmi.

Gambaran Umum

Selama penyiapan awal zona pendaratan data, Anda dapat menyebarkan satu ruang kerja Azure Synapse Analytics untuk digunakan oleh semua analis dan ilmuwan data. Anda dapat membuat lebih banyak ruang kerja untuk integrasi data atau produk data tertentu.

Anda mungkin memerlukan ruang kerja Azure Synapse Analytics tambahan jika produk data Anda perlu menyediakan akses ke data standar dengan keamanan tingkat baris dan tingkat kolom. Anda dapat menyediakan ruang kerja ini dengan kumpulan Azure Synapse. Tim produk data mungkin memerlukan ruang kerja mereka sendiri untuk membuat produk data dan ruang kerja terpisah yang hanya ditujukan untuk tim produk dengan akses pengembangan cakupan.

Penyiapan Azure Synapse Analytics

Langkah pertama dalam penyebaran Azure Synapse Analytics adalah menyiapkan ruang kerja Azure Synapse yang terhubung ke akun Azure Purview.

Jaringan Azure Synapse Analytics

Zona pendaratan data membuat ruang kerja dengan jaringan virtual terkelola Azure Synapse Analytics. Komunikasi dengan Azure Synapse terjadi melalui tiga titik akhir yang dieksposnya: kumpulan SQL, SQL sesuai permintaan, dan titik akhir pengembangan.

Pada tingkat jaringan, analitik skala cloud menggunakan titik akhir privat yang dikelola synapse. Titik akhir ini memastikan semua lalu lintas antara jaringan virtual zona pendaratan data dan ruang kerja Azure Synapse bergerak sepenuhnya melalui jaringan backbone Microsoft.

Kontrol akses data Azure Synapse

Gunakan daftar kontrol akses dengan pass-through Microsoft Entra di Azure Synapse Analytics untuk mengelola akses ke file di data lake.

Untuk data tempat Anda perlu membatasi kolom dan baris yang dikembalikan, sebaiknya batasi keamanan tingkat baris dan tingkat kolom untuk membatasi akses data pada tabel di kumpulan khusus atau tanpa server Azure Synapse SQL. Keamanan tingkat baris dan keamanan tingkat kolom diimplementasikan di tingkat database dan di samping peran database.

Misalnya, keamanan tingkat baris memastikan bahwa pengguna dalam aplikasi data tertentu (selaras sumber) atau produk data hanya melihat data mereka sendiri. Meskipun tabel berisi data untuk seluruh perusahaan.

Anda dapat menggabungkan keamanan tingkat baris dengan keamanan tingkat kolom guna membatasi akses ke kolom dengan data sensitif. Dengan cara ini, keamanan tingkat baris dan keamanan tingkat kolom menerapkan logika pembatasan akses di tingkat database daripada tingkat aplikasi. Izin dievaluasi setiap kali akses data dicoba dari tingkat mana pun.

Catatan

Kumpulan SQL tanpa server Azure Synapse mendukung keamanan tingkat kolom untuk tampilan dan bukan untuk tabel eksternal. Dalam kasus tabel eksternal, seseorang dapat membuat tampilan logis di atas tabel eksternal dan daripada menerapkan keamanan tingkat kolom. Dalam kasus keamanan tingkat baris, tampilan kustom dapat digunakan sebagai solusinya.

Untuk informasi selengkapnya, lihat Kontrol akses data Azure Synapse Analytics.

Kontrol akses data Azure Synapse di Azure Data Lake

Saat menyebarkan ruang kerja Azure Synapse Analytics, Anda memerlukan akun Azure Data Lake Storage dari langganan atau dengan menggunakan URL akun penyimpanan secara manual. Akun penyimpanan yang ditentukan ditetapkan sebagai utama untuk ruang kerja Azure Synapse yang disebarkan untuk menyimpan datanya. Azure Synapse menyimpan data dalam kontainer yang menyertakan tabel Apache Spark dan log aplikasi Spark dalam folder yang disebut /synapse/{workspaceName}. Ini juga memiliki kontainer untuk mengelola perpustakaan apa pun yang Anda pilih untuk diinstal.

Tip

Sebaiknya gunakan kontainer khusus pada lapisan Pengembangan atau data lake tiga akun. Kontainer ini digunakan sebagai penyimpanan utama untuk menyimpan metadata Spark.

Lihat Kontrol akses data Azure Synapse Analytics untuk rekomendasi tentang cara menyiapkan akses data.

Langkah berikutnya

Daftar periksa kesiapan Azure Purview untuk analitik skala cloud

Share via