Memahami kemampuan dan kasus penggunaan kumpulan SQL tanpa server Azure Synapse

Selesai

Azure Synapse Analytics adalah layanan analitik terintegrasi yang menyatukan berbagai teknologi yang umum digunakan untuk memproses dan menganalisis data dalam skala besar. Salah satu teknologi paling lazim yang digunakan dalam solusi data adalah SQL - bahasa standar industri untuk mengkueri dan memanipulasi data.

Kumpulan SQL tanpa server di Azure Synapse Analytics

Azure Synapse SQL adalah sistem kueri terdistribusi di Azure Synapse Analytics yang menawarkan dua jenis lingkungan runtime:

  • kumpulan SQL Tanpa Server: pemrosesan kueri SQL sesuai permintaan, terutama digunakan untuk bekerja dengan data di data lake.
  • kumpulan SQL Khusus: Instans database relasional skala perusahaan yang digunakan untuk menghosting gudang data tempat data disimpan dalam tabel relasional.

Dalam modul ini, kita akan fokus pada kumpulan SQL tanpa server, yang menyediakan titik akhir bayar per kueri untuk mengkueri data di data lake Anda. Manfaat menggunakan kumpulan SQL tanpa server meliputi:

  • Sintaks Transact-SQL yang familier untuk mengkueri data tanpa perlu menyalin atau memuat data ke penyimpanan khusus.
  • Konektivitas yang terintegrasi dari berbagai alat kecerdasan bisnis dan kueri ad-hoc, termasuk driver yang paling populer.
  • Pemrosesan kueri terdistribusi yang dibangun untuk data skala besar, dan fungsi komputasi - menghasilkan performa kueri yang cepat.
  • Toleransi kesalahan eksekusi kueri bawaan, menghasilkan tingkat keandalan dan keberhasilan yang tinggi bahkan untuk kueri yang berjalan lama yang melibatkan himpunan data besar.
  • Tidak ada infrastruktur untuk disiapkan atau kluster untuk dipertahankan. Titik akhir bawaan untuk layanan ini disediakan di setiap ruang kerja Azure Synapse, sehingga Anda dapat mulai mengkueri data segera setelah ruang kerja dibuat.
  • Tidak ada biaya untuk sumber daya yang dipesan, Anda hanya dikenakan biaya untuk data yang diproses oleh kueri yang Anda jalankan.

Kapan menggunakan kumpulan SQL tanpa server

Kumpulan SQL tanpa server disesuaikan untuk mengkueri data yang berada di data lake, jadi selain menghilangkan beban manajemen, ia menghilangkan kebutuhan untuk mengkhawatirkan penyerapan data ke dalam sistem. Anda cukup mengarahkan kueri ke data yang sudah ada di danau dan menjalankannya.

Model sumber daya serverless Synapse SQL sangat bagus untuk beban kerja yang tidak direncanakan atau "bursty" yang dapat diproses menggunakan endpoint SQL serverless yang selalu aktif dalam workspace Azure Synapse Analytics Anda. Menggunakan kumpulan tanpa server membantu ketika Anda perlu mengetahui biaya yang tepat untuk setiap kueri yang dijalankan untuk memantau dan mengaitkan biaya.

Nota

Kumpulan SQL tanpa server adalah sistem analitik dan tidak disarankan untuk beban kerja OLTP seperti database yang digunakan oleh aplikasi untuk menyimpan data transaksional. Beban kerja yang memerlukan waktu respons milidetik dan ingin menentukan satu baris dalam himpunan data tidak cocok untuk kumpulan SQL tanpa server.

Kasus penggunaan umum untuk kumpulan SQL tanpa server meliputi:

  • Eksplorasi data: Eksplorasi data melibatkan penelusuran data lake untuk mendapatkan wawasan awal tentang data, dan mudah dicapai dengan Azure Synapse Studio. Anda dapat menelusuri file di penyimpanan data lake tertaut Anda, dan menggunakan kumpulan SQL tanpa server bawaan untuk secara otomatis menghasilkan skrip SQL untuk memilih 100 baris TERATAS dari file atau folder seperti yang akan Anda lakukan dengan tabel di SQL Server. Dari sana, Anda dapat menerapkan proyeksi, pemfilteran, pengelompokan, dan sebagian besar operasi atas data seolah-olah data berada dalam tabel SQL Server biasa.
  • Transformasi data: Meskipun Azure Synapse Analytics menyediakan kemampuan transformasi data yang hebat dengan Synapse Spark, beberapa teknisi data mungkin menemukan transformasi data lebih mudah dicapai menggunakan SQL. Kumpulan SQL tanpa server memungkinkan Anda melakukan transformasi data berbasis SQL; baik secara interaktif atau sebagai bagian dari alur data otomatis.
  • Gudang data logis: Setelah eksplorasi awal data di data lake, Anda dapat menentukan objek eksternal seperti tabel dan tampilan dalam database SQL tanpa server. Data tetap disimpan dalam file data lake, tetapi diabstraksi oleh skema relasional yang dapat digunakan oleh aplikasi klien dan alat analitik untuk mengkueri data seperti yang mereka lakukan dalam database relasional yang dihosting di SQL Server.