Memperkenalkan kumpulan komputasi di SQL Server Kluster Big Data

Berlaku untuk: SQL Server 2019 (15.x)

Penting

Add-on Kluster Big Data Microsoft SQL Server 2019 akan dihentikan. Dukungan untuk Kluster Big Data SQL Server 2019 akan berakhir pada 28 Februari 2025. Semua pengguna SQL Server 2019 yang ada dengan Jaminan Perangkat Lunak akan didukung penuh pada platform dan perangkat lunak akan terus dipertahankan melalui pembaruan kumulatif SQL Server hingga saat itu. Untuk informasi selengkapnya, lihat posting blog pengumuman dan opsi Big data di platform Microsoft SQL Server.

Artikel ini menjelaskan peran SQL Server kumpulan komputasi dalam kluster big data SQL Server. Kumpulan komputasi menyediakan sumber daya komputasi peluasan skala untuk SQL Server kluster big data. Mereka digunakan untuk membongkar pekerjaan komputasi, atau tataan hasil perantara, dari instans master SQL Server. Bagian berikut menjelaskan arsitektur, fungsionalitas, dan skenario penggunaan kumpulan komputasi.

Anda juga dapat menonton video 5 menit ini untuk pengenalan kumpulan komputasi:

Arsitektur kumpulan komputasi

Kumpulan komputasi terbuat dari satu atau beberapa pod komputasi yang berjalan di Kubernetes. Pembuatan dan manajemen otomatis pod ini dikoordinasikan oleh instans master SQL Server. Setiap pod berisi serangkaian layanan dasar dan instans mesin database SQL Server.

Arsitektur kumpulan komputasi

Grup peluasan skala

Kumpulan komputasi dapat bertindak sebagai grup peluasan skala PolyBase untuk kueri terdistribusi melalui sumber data eksternal yang berbeda seperti SQL Server, Oracle, MongoDB, Teradata, dan HDFS. Dengan menggunakan pod komputasi di Kubernetes, kluster big data SQL Server dapat mengotomatiskan pembuatan dan konfigurasi pod komputasi untuk grup peluasan skala PolyBase.

Skenario kumpulan komputasi

Skenario di mana kumpulan komputasi digunakan meliputi:

  • Saat kueri yang dikirimkan ke instans master, gunakan satu atau beberapa tabel yang terletak di kumpulan penyimpanan.

  • Saat kueri yang dikirimkan ke instans master, gunakan satu atau beberapa tabel dengan distribusi round-robin yang terletak di kumpulan data.

  • Saat kueri yang dikirimkan ke instans master menggunakan tabel yang dipartisi dengan sumber data eksternal SQL Server, Oracle, MongoDB, dan Teradata. Untuk skenario ini, OPSI petunjuk kueri (FORCE SCALEOUTEXECUTION) harus diaktifkan.

  • Saat kueri yang dikirimkan ke instans master, gunakan satu atau beberapa tabel yang terletak di tingkatan HDFS.

Skenario di mana kumpulan komputasi tidak digunakan meliputi:

  • Saat kueri yang dikirimkan ke instans master, gunakan satu atau beberapa tabel di kluster HdFS Hadoop eksternal.

  • Saat kueri yang dikirimkan ke instans master, gunakan satu atau beberapa tabel di Azure Blob Storage.

  • Saat kueri yang dikirimkan ke instans master menggunakan tabel non-partisi dengan sumber data eksternal SQL Server, Oracle, MongoDB, dan Teradata.

  • Saat OPSI petunjuk kueri (DISABLE SCALEOUTEXECUTION) diaktifkan.

  • Saat kueri yang dikirimkan ke instans master berlaku untuk database yang terletak di instans master.

Langkah berikutnya

Untuk mempelajari selengkapnya tentang SQL Server Kluster Big Data, lihat sumber daya berikut ini: