Bagikan melalui


Memperkenalkan kumpulan master di SQL Server Kluster Big Data

Berlaku untuk: SQL Server 2019 (15.x)

Penting

Add-on Kluster Big Data Microsoft SQL Server 2019 akan dihentikan. Dukungan untuk SQL Server 2019 Kluster Big Data akan berakhir pada 28 Februari 2025. Semua pengguna SQL Server 2019 yang ada dengan Jaminan Perangkat Lunak akan didukung sepenuhnya pada platform dan perangkat lunak akan terus dipertahankan melalui pembaruan kumulatif SQL Server hingga saat itu. Untuk informasi selengkapnya, lihat posting blog pengumuman dan Opsi big data di platform Microsoft SQL Server.

Artikel ini menjelaskan peran instans master SQL Server dalam kluster big data SQL Server. Kumpulan master berisi instans master SQL Server. Instans master adalah instans SQL Server yang berjalan di kluster big data SQL Server. Instans master mengelola konektivitas, kueri peluasan skala, metadata dan database pengguna, dan layanan pembelajaran mesin.

Instans master SQL Server menyediakan fungsionalitas berikut:

Konektivitas

Instans master SQL Server menyediakan titik akhir TDS yang dapat diakses secara eksternal untuk kluster. Anda dapat menghubungkan aplikasi atau alat SQL Server seperti Azure Data Studio atau SQL Server Management Studio ke titik akhir ini sama seperti instans SQL Server lainnya.

Manajemen kueri peluasan skala

Instans master SQL Server berisi mesin kueri peluasan skala yang digunakan untuk mendistribusikan kueri di seluruh instans SQL Server pada simpul di kumpulan komputasi. Mesin kueri peluasan skala juga menyediakan akses melalui Transact-SQL ke semua tabel Apache Hive di kluster tanpa konfigurasi lagi.

Metadata dan database pengguna

Selain database sistem SQL Server standar, instans master SQL juga berisi:

  • Database metadata yang menyimpan metadata tabel HDFS.
  • Peta shard sarana data.
  • Detail tabel eksternal yang menyediakan akses ke bidang data kluster.
  • Sumber data eksternal PolyBase dan tabel eksternal yang ditentukan dalam database pengguna.

Anda juga dapat memilih untuk menambahkan database pengguna Anda sendiri ke instans master SQL Server.

Layanan pembelajaran mesin

Fitur layanan pembelajaran mesin SQL Server adalah fitur add-on ke mesin database. Fitur layanan pembelajaran mesin yang digunakan untuk mengeksekusi kode Java, R, dan Python di SQL Server. Fitur ini didasarkan pada kerangka kerja ekstensibilitas SQL Server, yang mengisolasi proses eksternal dari proses mesin inti, tetapi sepenuhnya terintegrasi dengan data relasional sebagai prosedur tersimpan, sebagai skrip T-SQL yang berisi pernyataan R atau Python, atau sebagai kode Java, R atau Python yang berisi T-SQL.

Sebagai bagian dari kluster big data SQL Server, layanan pembelajaran mesin akan tersedia pada instans master SQL Server secara default. Setelah eksekusi skrip eksternal diaktifkan pada instans master SQL Server, dimungkinkan untuk menjalankan skrip Java, R, dan Python menggunakan sp_execute_external_script.

Keuntungan layanan pembelajaran mesin dalam kluster big data

SQL Server Kluster Big Data memudahkan big data untuk digabungkan ke data dimensi yang biasanya disimpan dalam database perusahaan. Nilai big data sangat meningkat ketika tidak hanya di tangan bagian organisasi, tetapi juga termasuk dalam laporan, dasbor, dan aplikasi. Pada saat yang sama, ilmuwan data dapat terus menggunakan alat ekosistem Spark/HDFS dan memiliki akses real time yang mudah ke data dalam instans master SQL Server dan di sumber data eksternal yang dapat diakses melalui instans master SQL Server.

Dengan SQL Server Kluster Big Data, Anda dapat melakukan lebih banyak hal dengan data lake perusahaan Anda. Pengembang dan analis SQL Server dapat:

  • Membangun aplikasi yang mengkonsumsi data dari data lake perusahaan.
  • Alasan atas semua data dengan kueri Transact-SQL.
  • Gunakan ekosistem alat dan aplikasi SQL Server yang ada untuk mengakses dan menganalisis data perusahaan.
  • Kurangi kebutuhan akan pergerakan data melalui virtualisasi data dan mart data.
  • Terus gunakan Spark untuk skenario big data.
  • Bangun aplikasi perusahaan cerdas menggunakan Spark atau SQL Server untuk melatih model melalui data lake.
  • Operasionalkan model dalam database produksi untuk performa terbaik.
  • Streaming data langsung ke mart data perusahaan untuk analitik real time.
  • Jelajahi data secara visual menggunakan analisis interaktif dan alat BI.

Langkah berikutnya

Untuk mempelajari selengkapnya tentang Kluster Big Data SQL Server, lihat sumber daya berikut ini: