Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Pelajari cara memperkaya data Anda dengan mudah di kumpulan SQL khusus dengan model pembelajaran mesin prediktif. Model yang dibuat ilmuwan data Anda sekarang mudah diakses oleh profesional data untuk analitik prediktif. Profesional data di Azure Synapse Analytics cukup memilih model dari registri model Azure Machine Learning untuk penyebaran di kumpulan Azure Synapse SQL dan meluncurkan prediksi untuk memperkaya data.
Dalam tutorial ini, Anda akan mempelajari cara:
- Melatih model pembelajaran mesin prediktif dan mendaftarkan model dalam registri model Azure Machine Learning.
- Menggunakan wizard penilaian SQL untuk meluncurkan prediksi dalam kumpulan SQL khusus.
Jika Anda tidak memiliki langganan Azure, buat akun gratis sebelum memulai.
Prasyarat
- Ruang kerja Azure Synapse Analytics dengan akun penyimpanan Azure Data Lake Storage Gen2 dikonfigurasi sebagai penyimpanan default. Anda harus menjadi Kontributor Data Blob di Penyimpanan untuk sistem file Data Lake Storage Gen2 yang Anda gunakan.
- Kumpulan SQL khusus di ruang kerja Azure Synapse Analytics Anda. Untuk detailnya, lihat Membuat kumpulan SQL khusus.
- Layanan tertaut Azure Machine Learning di ruang kerja Azure Synapse Analytics Anda. Untuk detailnya, lihat Membuat layanan tertaut Azure Machine Learning di Azure Synapse.
Masuk ke portal Microsoft Azure
Masuk ke portal Azure.
Melatih model di Azure Machine Learning
Sebelum memulai, verifikasi bahwa versi sklearn Anda adalah 0.20.3.
Sebelum Anda menjalankan semua sel di buku catatan, periksa apakah instans komputasi sedang berjalan.
Buka ruang kerja Azure Machine Learning Anda.
Unduh Predict NYC Taxi Tips.ipynb.
Buka ruang kerja Azure Machine Learning di Azure Machine Learning Studio.
Masuk ke Notebook>Unggah file. Kemudian pilih file Predict NYC Taxi Tips.ipynb yang Anda unduh dan unggah.
Setelah buku catatan diunggah dan dibuka, pilih Jalankan semua sel.
Salah satu sel mungkin gagal dan meminta Anda untuk mengautentikasi ke Azure. Perhatikan keluaran sel ini, dan lakukan autentikasi di browser Anda dengan mengikuti tautan dan memasukkan kode. Kemudian jalankan kembali buku catatan.
Notebook akan melatih model ONNX dan mendaftarkannya dengan MLflow. Buka Model untuk memeriksa apakah model baru terdaftar dengan benar.
Menjalankan notebook juga akan mengekspor data pengujian ke dalam file CSV. Unduh file CSV ke sistem lokal Anda. Nantinya, Anda akan mengimpor file CSV ke kumpulan SQL khusus dan menggunakan data untuk menguji model.
File CSV dibuat di folder yang sama dengan file buku catatan Anda. Pilih Refresh di File Explorer jika Anda tidak segera melihatnya.
Aktifkan prediksi dengan wizard pemeringkatan SQL
Buka ruang kerja Azure Synapse dengan Synapse Studio.
Buka Data>Akun Penyimpanan Tertaut>. Unggah
test_data.csvke akun penyimpanan default.
Pergi ke Pengembangan>skrip SQL. Buat skrip SQL baru untuk dimuat
test_data.csvke kumpulan SQL khusus Anda.Nota
Perbarui URL file dalam skrip ini sebelum menjalankannya.
IF NOT EXISTS (SELECT * FROM sys.objects WHERE NAME = 'nyc_taxi' AND TYPE = 'U') CREATE TABLE dbo.nyc_taxi ( tipped int, fareAmount float, paymentType int, passengerCount int, tripDistance float, tripTimeSecs bigint, pickupTimeBin nvarchar(30) ) WITH ( DISTRIBUTION = ROUND_ROBIN, CLUSTERED COLUMNSTORE INDEX ) GO COPY INTO dbo.nyc_taxi (tipped 1, fareAmount 2, paymentType 3, passengerCount 4, tripDistance 5, tripTimeSecs 6, pickupTimeBin 7) FROM '<URL to linked storage account>/test_data.csv' WITH ( FILE_TYPE = 'CSV', ROWTERMINATOR='0x0A', FIELDQUOTE = '"', FIELDTERMINATOR = ',', FIRSTROW = 2 ) GO SELECT TOP 100 * FROM nyc_taxi GO
Pergi ke Data>Ruang Kerja. Buka wizard penilaian SQL dengan mengklik kanan tabel kumpulan SQL khusus. Pilih Pembelajaran Mesin>Prediksi dengan model.
Nota
Opsi pembelajaran mesin tidak muncul kecuali Anda memiliki layanan tertaut yang dibuat untuk Azure Machine Learning. (Lihat Prasyarat di awal tutorial ini.)
Pilih ruang kerja Azure Machine Learning tertaut di kotak drop-down. Langkah ini memuat daftar model pembelajaran mesin dari registri model ruang kerja Azure Machine Learning yang dipilih. Saat ini, hanya model ONNX yang didukung, sehingga langkah ini hanya akan menampilkan model ONNX.
Pilih model yang baru saja Anda latih, lalu pilih Lanjutkan.
Petakan kolom tabel ke input model dan tentukan output model. Jika model disimpan dalam format MLflow dan tanda tangan model diisi, pemetaan akan dilakukan secara otomatis untuk Anda dengan menggunakan logika berdasarkan kesamaan nama. Antarmuka juga mendukung pemetaan manual.
Pilih Lanjutkan.
Kode T-SQL yang dihasilkan dibungkus di dalam prosedur tersimpan. Inilah sebabnya mengapa Anda perlu memberikan nama prosedur tersimpan. Biner model, termasuk metadata (versi, deskripsi, dan informasi lainnya), akan disalin secara fisik dari Azure Machine Learning ke tabel kumpulan SQL khusus. Jadi Anda perlu menentukan tabel mana yang akan disimpan modelnya.
Anda dapat memilih tabel yang Sudah Ada atau Buat baru. Setelah selesai, pilih Sebarkan model + buka skrip untuk menyebarkan model dan membuat skrip prediksi T-SQL.
Setelah skrip dibuat, pilih Jalankan untuk menjalankan penilaian dan mendapatkan prediksi.