Bagikan melalui


Jalankan skrip Python dan R dengan Layanan Pembelajaran Mesin di Kluster Big Data SQL Server 2019

Berlaku untuk: SQL Server 2019 (15.x)

Important

Kluster Big Data Microsoft SQL Server 2019 dihentikan. Dukungan untuk Kluster Big Data SQL Server 2019 berakhir per 28 Februari 2025. Untuk informasi selengkapnya, lihat posting blog pengumuman dan Opsi big data di platform Microsoft SQL Server.

Anda dapat menjalankan skrip Python dan R pada instans master Kluster Big Data SQL Server dengan Layanan Pembelajaran Mesin.

Note

Anda juga dapat menjalankan kode Java pada instans master Kluster Big Data SQL Server dengan Ekstensi Bahasa Java. Mengikuti langkah-langkah di bawah ini juga akan mengaktifkan Ekstensi Bahasa SQL Server.

Aktifkan Layanan Pembelajaran Mesin

Layanan Pembelajaran Mesin diinstal secara default pada Kluster Big Data SQL Server 2019 dan tidak memerlukan penginstalan terpisah.

Untuk mengaktifkan Layanan Pembelajaran Mesin, jalankan pernyataan ini pada instans master:

EXEC sp_configure 'external scripts enabled', 1
RECONFIGURE WITH OVERRIDE
GO

Anda sekarang siap untuk menjalankan skrip Python dan R pada instans master Kluster Big Data. Lihat panduan cepat di bagian Langkah berikutnya untuk menjalankan skrip pertama Anda.

Note

Pengaturan konfigurasi tidak dapat diatur pada koneksi pendengar grup ketersediaan. Jika Kluster Big Data disebarkan dengan ketersediaan tinggi, set external scripts enabled pada setiap replika. Lihat Aktifkan pada kluster dengan ketersediaan tinggi.

Aktifkan pada kluster dengan ketersediaan tinggi

Saat Anda Menyebarkan Kluster Big Data SQL Server dengan ketersediaan tinggi, penyebaran membuat grup ketersediaan untuk instans master. Untuk mengaktifkan Layanan Pembelajaran Mesin, atur external scripts enabled pada setiap instans grup ketersediaan. Untuk Kluster Big Data, Anda perlu menjalankan sp_configure pada setiap replika instans utama SQL Server

Bagian berikut menjelaskan cara mengaktifkan skrip eksternal pada setiap instans.

Buat load balancer eksternal untuk setiap instans

Untuk setiap replika pada grup ketersediaan, buat penyeimbang beban untuk memungkinkan Anda terhubung ke instans.

kubectl expose pod <pod-name> --port=<connection port number> --name=<load-balancer-name> --type=LoadBalancer -n <kubernetes namespace>

Contoh dalam artikel ini menggunakan nilai berikut:

  • <pod-name>: master-#
  • <connection port number>: 1533
  • <load-balancer-name>: mymaster-#
  • <kubernetes namespace>: mssql-cluster

Perbarui skrip berikut untuk lingkungan Anda, dan jalankan perintah:

kubectl expose pod master-0 --port=1533 --name=mymaster-0 --type=LoadBalancer -n mssql-cluster
kubectl expose pod master-1 --port=1533 --name=mymaster-1 --type=LoadBalancer -n mssql-cluster
kubectl expose pod master-2 --port=1533 --name=mymaster-2 --type=LoadBalancer -n mssql-cluster

kubectl mengembalikan output berikut.

service/mymaster-0 exposed
service/mymaster-1 exposed
service/mymaster-2 exposed

Setiap load balancer adalah titik akhir replika master.

Mengaktifkan eksekusi skrip pada setiap replika

  1. Dapatkan alamat IP untuk titik akhir replika master.

    Perintah berikut mengembalikan alamat IP eksternal untuk titik akhir replika.

    kubectl get services <load-balancer-name> -n <kubernetes namespace>

    Untuk mendapatkan alamat IP eksternal untuk setiap replika dalam skenario ini, jalankan perintah berikut:

    kubectl get services mymaster-0 -n mssql-cluster
    kubectl get services mymaster-1 -n mssql-cluster
    kubectl get services mymaster-2 -n mssql-cluster
    

    Note

    Mungkin perlu sedikit waktu sebelum alamat IP eksternal tersedia. Jalankan skrip sebelumnya secara berkala hingga setiap titik akhir mengembalikan alamat IP eksternal.

  2. Sambungkan ke titik akhir replika master dan aktifkan eksekusi skrip.

    Jalankan pernyataan ini:

    EXEC sp_configure 'external scripts enabled', 1
    RECONFIGURE WITH OVERRIDE
    GO
    

    Misalnya, Anda dapat menjalankan perintah sebelumnya dengan sqlcmd. Contoh berikut terhubung ke titik akhir replika master dan mengaktifkan eksekusi skrip. Perbarui nilai dalam skrip dengan yang sesuai untuk lingkungan Anda.

    sqlcmd -S <IP address>,1533 -U <user name> -P <password> -Q "EXEC sp_configure 'external scripts enabled', 1; RECONFIGURE WITH OVERRIDE;"
    

    Ulangi langkah untuk setiap replika.

Demonstration

Gambar berikut menunjukkan proses ini.

Cuplikan layar prompt perintah yang menyediakan demo langkah-langkah yang diperlukan untuk mengaktifkan skrip eksternal.

Anda sekarang siap untuk menjalankan skrip Python dan R pada instans master Kluster Big Data. Lihat panduan cepat di bagian Langkah berikutnya untuk menjalankan skrip pertama Anda.

Menghapus titik akhir replika master

Pada kluster Kubernetes, hapus titik akhir untuk setiap replika. Titik akhir diekspos di Kubernetes sebagai layanan penyeimbang beban.

Perintah berikut menghapus layanan penyeimbangan beban.

kubectl delete svc <load-balancer-name> -n mssql-cluster

Untuk contoh dalam artikel ini, jalankan perintah berikut.

kubectl delete svc mymaster-0 -n mssql-cluster
kubectl delete svc mymaster-1 -n mssql-cluster
kubectl delete svc mymaster-2 -n mssql-cluster

Mulai cepat pembelajaran mesin Kluster Big Data SQL Server

Python quickstarts

R quickstarts

Tutorial pembelajaran mesin Kluster Big Data SQL Server

Python tutorial

Penyewaan ski (regresi linear)

Mengategorikan pelanggan (klasterisasi k-means)

Tips taksi NYC (klasifikasi)

R tutorials

Penyewaan ski (diagram pohon keputusan)

Mengategorikan pelanggan (klasterisasi k-means)

Tips taksi NYC (klasifikasi)

Panduan cara pembelajaran mesin SQL Server Big Data Clusters

Penjelajahan dan pemodelan data

Konversi jenis-jenis data

Deploy

Predictions

Package management

Pasang paket Python baru

Pasang paket R baru

Monitor

Keamanan

Pembelajaran Mesin Spark

Next steps