Bagikan melalui


Tutorial: Wizard penilaian model pembelajaran mesin untuk kumpulan SQL khusus

Pelajari cara memperkaya data Anda dengan mudah di kumpulan SQL khusus dengan model pembelajaran mesin prediktif. Model yang dibuat ilmuwan data Anda sekarang mudah diakses oleh profesional data untuk analitik prediktif. Profesional data di Azure Synapse Analytics cukup memilih model dari registri model Azure Machine Learning untuk penyebaran di kumpulan Azure Synapse SQL dan meluncurkan prediksi untuk memperkaya data.

Dalam tutorial ini, Anda akan mempelajari cara:

  • Melatih model pembelajaran mesin prediktif dan mendaftarkan model dalam registri model Azure Machine Learning.
  • Menggunakan wizard penilaian SQL untuk meluncurkan prediksi dalam kumpulan SQL khusus.

Jika Anda tidak memiliki langganan Azure, buat akun gratis sebelum memulai.

Prasyarat

Masuk ke portal Microsoft Azure

Masuk ke portal Azure.

Melatih model di Azure Machine Learning

Sebelum memulai, verifikasi bahwa versi sklearn Anda adalah 0.20.3.

Sebelum Anda menjalankan semua sel di buku catatan, periksa apakah instans komputasi sedang berjalan.

Cuplikan layar yang memperlihatkan verifikasi komputasi Azure Machine Learning.

  1. Buka ruang kerja Azure Machine Learning Anda.

  2. Unduh Predict NYC Taxi Tips.ipynb.

  3. Buka ruang kerja Azure Machine Learning di Azure Machine Learning Studio.

  4. Masuk ke Notebook>Unggah file. Kemudian pilih file Predict NYC Taxi Tips.ipynb yang Anda unduh dan unggah. Cuplikan layar tombol untuk mengunggah file.

  5. Setelah buku catatan diunggah dan dibuka, pilih Jalankan semua sel.

    Salah satu sel mungkin gagal dan meminta Anda untuk mengautentikasi ke Azure. Perhatikan keluaran sel ini, dan lakukan autentikasi di browser Anda dengan mengikuti tautan dan memasukkan kode. Kemudian jalankan kembali buku catatan.

  6. Notebook akan melatih model ONNX dan mendaftarkannya dengan MLflow. Buka Model untuk memeriksa apakah model baru terdaftar dengan benar. Cuplikan layar yang memperlihatkan model dalam registri.

  7. Menjalankan notebook juga akan mengekspor data pengujian ke dalam file CSV. Unduh file CSV ke sistem lokal Anda. Nantinya, Anda akan mengimpor file CSV ke kumpulan SQL khusus dan menggunakan data untuk menguji model.

    File CSV dibuat di folder yang sama dengan file buku catatan Anda. Pilih Refresh di File Explorer jika Anda tidak segera melihatnya.

    Cuplikan layar yang memperlihatkan file C S V.

Aktifkan prediksi dengan wizard pemeringkatan SQL

  1. Buka ruang kerja Azure Synapse dengan Synapse Studio.

  2. Buka Data>Akun Penyimpanan Tertaut>. Unggah test_data.csv ke akun penyimpanan default.

    Cuplikan layar yang memperlihatkan pilihan untuk mengunggah data.

  3. Pergi ke Pengembangan>skrip SQL. Buat skrip SQL baru untuk dimuat test_data.csv ke kumpulan SQL khusus Anda.

    Nota

    Perbarui URL file dalam skrip ini sebelum menjalankannya.

    IF NOT EXISTS (SELECT * FROM sys.objects WHERE NAME = 'nyc_taxi' AND TYPE = 'U')
    CREATE TABLE dbo.nyc_taxi
    (
        tipped int,
        fareAmount float,
        paymentType int,
        passengerCount int,
        tripDistance float,
        tripTimeSecs bigint,
        pickupTimeBin nvarchar(30)
    )
    WITH
    (
        DISTRIBUTION = ROUND_ROBIN,
        CLUSTERED COLUMNSTORE INDEX
    )
    GO
    
    COPY INTO dbo.nyc_taxi
    (tipped 1, fareAmount 2, paymentType 3, passengerCount 4, tripDistance 5, tripTimeSecs 6, pickupTimeBin 7)
    FROM '<URL to linked storage account>/test_data.csv'
    WITH
    (
        FILE_TYPE = 'CSV',
        ROWTERMINATOR='0x0A',
        FIELDQUOTE = '"',
        FIELDTERMINATOR = ',',
        FIRSTROW = 2
    )
    GO
    
    SELECT TOP 100 * FROM nyc_taxi
    GO
    

    Memuat data ke kumpulan SQL khusus

  4. Pergi ke Data>Ruang Kerja. Buka wizard penilaian SQL dengan mengklik kanan tabel kumpulan SQL khusus. Pilih Pembelajaran Mesin>Prediksi dengan model.

    Nota

    Opsi pembelajaran mesin tidak muncul kecuali Anda memiliki layanan tertaut yang dibuat untuk Azure Machine Learning. (Lihat Prasyarat di awal tutorial ini.)

    Cuplikan layar yang memperlihatkan opsi Pembelajaran mesin.

  5. Pilih ruang kerja Azure Machine Learning tertaut di kotak drop-down. Langkah ini memuat daftar model pembelajaran mesin dari registri model ruang kerja Azure Machine Learning yang dipilih. Saat ini, hanya model ONNX yang didukung, sehingga langkah ini hanya akan menampilkan model ONNX.

  6. Pilih model yang baru saja Anda latih, lalu pilih Lanjutkan.

    Cuplikan layar yang memperlihatkan memilih model Azure Machine Learning.

  7. Petakan kolom tabel ke input model dan tentukan output model. Jika model disimpan dalam format MLflow dan tanda tangan model diisi, pemetaan akan dilakukan secara otomatis untuk Anda dengan menggunakan logika berdasarkan kesamaan nama. Antarmuka juga mendukung pemetaan manual.

    Pilih Lanjutkan.

    Cuplikan layar yang memperlihatkan pemetaan tabel ke model.

  8. Kode T-SQL yang dihasilkan dibungkus di dalam prosedur tersimpan. Inilah sebabnya mengapa Anda perlu memberikan nama prosedur tersimpan. Biner model, termasuk metadata (versi, deskripsi, dan informasi lainnya), akan disalin secara fisik dari Azure Machine Learning ke tabel kumpulan SQL khusus. Jadi Anda perlu menentukan tabel mana yang akan disimpan modelnya.

    Anda dapat memilih tabel yang Sudah Ada atau Buat baru. Setelah selesai, pilih Sebarkan model + buka skrip untuk menyebarkan model dan membuat skrip prediksi T-SQL.

    Cuplikan layar yang memperlihatkan pilihan untuk membuat prosedur tersimpan.

  9. Setelah skrip dibuat, pilih Jalankan untuk menjalankan penilaian dan mendapatkan prediksi.

    Cuplikan layar yang memperlihatkan penilaian dan prediksi.

Langkah selanjutnya