Memperkenalkan kumpulan komputasi di SQL Server Kluster Big Data
Berlaku untuk: SQL Server 2019 (15.x)
Penting
Add-on Kluster Big Data Microsoft SQL Server 2019 akan dihentikan. Dukungan untuk SQL Server 2019 Kluster Big Data akan berakhir pada 28 Februari 2025. Semua pengguna SQL Server 2019 yang ada dengan Jaminan Perangkat Lunak akan didukung sepenuhnya pada platform dan perangkat lunak akan terus dipertahankan melalui pembaruan kumulatif SQL Server hingga saat itu. Untuk informasi selengkapnya, lihat posting blog pengumuman dan Opsi big data di platform Microsoft SQL Server.
Artikel ini menjelaskan peran kumpulan komputasi SQL Server dalam kluster big data SQL Server. Kumpulan komputasi menyediakan sumber daya komputasi peluasan skala untuk kluster big data SQL Server. Mereka digunakan untuk membongkar pekerjaan komputasi, atau kumpulan hasil menengah, dari instans master SQL Server. Bagian berikut menjelaskan arsitektur, fungsionalitas, dan skenario penggunaan kumpulan komputasi.
Anda juga dapat menonton video 5 menit ini untuk pengenalan kumpulan komputasi:
Arsitektur kumpulan komputasi
Kumpulan komputasi terbuat dari satu atau beberapa pod komputasi yang berjalan di Kubernetes. Pembuatan dan pengelolaan otomatis pod ini dikoordinasikan oleh instans master SQL Server. Setiap pod berisi sekumpulan layanan dasar dan instans mesin database SQL Server.
Grup peluasan skala
Kumpulan komputasi dapat bertindak sebagai grup peluasan skala PolyBase untuk kueri terdistribusi melalui sumber data eksternal yang berbeda seperti SQL Server, Oracle, MongoDB, Teradata, dan HDFS. Dengan menggunakan pod komputasi di Kubernetes, kluster big data SQL Server dapat mengotomatiskan pembuatan dan konfigurasi pod komputasi untuk grup peluasan skala PolyBase.
Skenario kumpulan komputasi
Skenario di mana kumpulan komputasi digunakan meliputi:
Saat kueri yang dikirimkan ke instans master, gunakan satu atau beberapa tabel yang terletak di kumpulan penyimpanan.
Saat kueri dikirimkan ke instans master, gunakan satu atau beberapa tabel dengan distribusi round-robin yang terletak di kumpulan data.
Saat kueri yang dikirimkan ke instans master, gunakan tabel yang dipartisi dengan sumber data eksternal SQL Server, Oracle, MongoDB, dan Teradata. Untuk skenario ini, OPSI petunjuk kueri (FORCE SCALEOUTEXECUTION) harus diaktifkan.
Saat kueri yang dikirimkan ke instans master, gunakan satu atau beberapa tabel yang terletak di tingkatan HDFS.
Skenario di mana kumpulan komputasi tidak digunakan meliputi:
Saat kueri yang dikirimkan ke instans master, gunakan satu atau beberapa tabel di kluster HDFS Hadoop eksternal.
Saat kueri yang dikirimkan ke instans master, gunakan satu atau beberapa tabel di Azure Blob Storage.
Saat kueri yang dikirimkan ke instans master, gunakan tabel non-partisi dengan sumber data eksternal SQL Server, Oracle, MongoDB, dan Teradata.
Saat OPSI petunjuk kueri (DISABLE SCALEOUTEXECUTION) diaktifkan.
Saat kueri yang dikirimkan ke instans master berlaku untuk database yang terletak di instans master.
Langkah berikutnya
Untuk mempelajari selengkapnya tentang Kluster Big Data SQL Server, lihat sumber daya berikut ini: