Tutorial: Desainer - latih model regresi tanpa kode

Latih model regresi linier yang memprediksi harga mobil menggunakan Azure Machine Learning desainer. Tutorial ini adalah bagian pertama dari seri dua bagian.

Tutorial ini menggunakan perancang Azure Machine Learning, untuk informasi selengkapnya lihat Apa itu perancang Azure Machine Learning?

Di bagian pertama tutorial, Anda akan mempelajari cara:

  • Membuat alur baru.
  • Mengimpor data.
  • Menyiapkan data.
  • Melatih model pembelajaran mesin.
  • Mengevaluasi model pembelajaran mesin.

Di bagian kedua tutorial, Anda akan menyebarkan model Anda sebagai titik akhir inferensi real time untuk memprediksi harga mobil apa pun berdasarkan spesifikasi teknis yang Anda kirimkan.

Catatan

Versi lengkap tutorial ini tersedia sebagai alur sampel.

Untuk menemukan versi lengkap, buka perancang di ruang kerja Anda. Di bagian Alur baru, pilih Sampel 1 - Regresi: Prediksi Harga Mobil (Dasar) .

Penting

Jika Anda tidak melihat elemen grafis yang disebutkan dalam dokumen ini, seperti tombol di studio atau perancang, Anda mungkin tidak memiliki tingkat izin yang tepat ke ruang kerja. Silakan hubungi administrator langganan Azure Anda untuk memverifikasi bahwa Anda telah diberikan tingkat akses yang benar. Untuk informasi selengkapnya, lihat Mengelola pengguna dan peran.

Buat alur baru

Alur Azure Machine Learning mengatur beberapa pembelajaran mesin dan langkah-langkah pemrosesan data ke dalam satu sumber daya. Alur memungkinkan Anda mengatur, mengelola, dan menggunakan kembali alur kerja pembelajaran mesin yang kompleks di seluruh proyek dan pengguna.

Untuk membuat alur Azure Machine Learning, Anda memerlukan ruang kerja Azure Machine Learning. Di bagian ini, Anda mempelajari cara membuat kedua sumber daya ini.

Buat ruang kerja baru

Anda memerlukan ruang kerja Azure Machine Learning untuk menggunakan perancang. Ruang kerja adalah sumber daya tingkat atas untuk Azure Machine Learning, ruang kerja memberikan tempat terpusat untuk bekerja dengan semua artefak yang Anda buat di Azure Machine Learning. Untuk instruksi tentang membuat ruang kerja, lihat Membuat dan mengelola ruang kerja Azure Machine Learning.

Catatan

Jika ruang kerja Anda menggunakan Jaringan virtual, ada langkah-langkah konfigurasi tambahan yang harus Anda gunakan untuk menggunakan perancang. Untuk mengetahui informasi selengkapnya, lihat Menggunakan studio Azure Machine Learning di jaringan virtual Azure

Membuat alur

  1. Masuk ke ml.azure.com, dan pilih ruang kerja yang ingin Anda gunakan.

  2. Pilih Perancang.

    Screenshot of the visual workspace showing how to access the designer.

  3. Pilih Komponen bawaan yang mudah digunakan.

  4. Di bagian atas kanvas, pilih nama alur default Pipeline-Created-on. Ganti nama alur menjadi Prediksi harga mobil. Nama tidak perlu unik.

Mengatur target komputasi default

Alur berjalan pada target komputasi, yang merupakan sumber daya komputasi yang dilampirkan pada ruang kerja Anda. Setelah membuat target komputasi, Anda dapat menggunakannya kembali untuk eksekusi masa mendatang.

Penting

Komputasi terlampir tidak didukung, gunakan instans atau kluster komputasi sebagai gantinya.

Anda dapat mengatur Target komputasi default untuk seluruh alur, yang akan memberi tahu setiap komponen untuk menggunakan target komputasi yang sama secara default. Namun, Anda dapat menentukan target komputasi berdasarkan per modul.

  1. Di samping nama alur, pilih Ikon gerigiScreenshot of the gear icon that is in the UI. di bagian atas kanvas untuk membuka panel Pengaturan.

  2. Di panel Pengaturan di sebelah kanan kanvas, klik Pilih target komputasi.

    Jika Anda sudah memiliki target komputasi yang tersedia, Anda dapat memilih target komputasi untuk menjalankan alur ini.

  3. Masukkan nama untuk sumber daya komputasi.

  4. Pilih Simpan.

    Catatan

    Dibutuhkan sekitar lima menit untuk membuat sumber daya komputasi. Setelah sumber daya dibuat, Anda dapat menggunakan sumber daya kembali dan melompati waktu tunggu ini untuk eksekusi di masa mendatang.

    Sumber daya komputasi menskalakan otomatis ke nol simpul ketika tidak digunakan untuk menghemat biaya. Ketika Anda menggunakan sumber daya komputasi lagi setelah penundaan, Anda mungkin mengalami sekitar lima menit waktu tunggu saat sumber daya komputasi menskalakan kembali.

Impor data

Ada beberapa himpunan data sampel yang disertakan dalam perancang untuk Anda bereksperimen. Untuk tutorial ini, gunakan Data harga mobil (Mentah) .

  1. Di sebelah kiri kanvas alur adalah palet himpunan data dan komponen. Pilih Himpunan data sampel untuk melihat himpunan data sampel yang tersedia.

  2. Pilih himpunan data Data harga mobil (Mentah) , dan seret himpunan data ke kanvas.

    Gif of dragging the Automobile price data to the canvas.

Visualisasikan data

Anda dapat memvisualisasikan data untuk memahami himpunan data yang akan Anda gunakan.

  1. Klik kanan Data harga mobil (Mentah) dan pilih Pratinjau Data.

  2. Pilih kolom yang berbeda di jendela data untuk melihat informasi tentang masing-masing kolom.

    Masing-masing baris mewakili mobil, dan variabel yang terkait dengan setiap mobil muncul sebagai kolom. Ada 205 baris dan 26 kolom dalam himpunan data ini.

Siapkan data

Himpunan data biasanya memerlukan beberapa prapemrosesan sebelum analisis. Anda mungkin telah melihat beberapa nilai yang hilang saat Anda memeriksa himpunan data. Nilai yang hilang ini harus dibersihkan sehingga model dapat menganalisis data dengan benar.

Menghapus kolom

Saat Anda melatih model, Anda harus melakukan sesuatu tentang data yang hilang. Dalam himpunan data ini, kolom kerugian yang dinormalisasikan memiliki banyak nilai yang hilang, sehingga Anda akan mengecualikan kolom tersebut dari model sepenuhnya.

  1. Di palet komponen di sebelah kiri kanvas, luaskan bagian Transformasi Data dan temukan komponen Memilih Kolom di Himpunan Data.

  2. Seret komponen Memilih Kolom di Himpunan Data ke kanvas. Jatuhkan komponen di bawah komponen himpunan data.

  3. Sambungkan himpunan data Data harga mobil (Mentah) ke komponen Memilih Kolom di Himpunan Data. Seret dari port output himpunan data, yang merupakan lingkaran kecil di bagian bawah himpunan data pada kanvas, ke port input Memilih Kolom di Himpunan Data, yang merupakan lingkaran kecil di bagian atas komponen.

    Tip

    Anda membuat alur data melalui alur Anda ketika menyambungkan port output dari satu komponen ke port input dari yang lain.

    Screenshot of connecting Automobile price data component to select columns in dataset component.

  4. Pilih komponen Memilih Kolom di Himpunan Data.

  5. Di panel detail komponen di sebelah kanan kanvas, pilih Edit kolom.

  6. Luaskan daftar drop-down Nama kolom di samping Sertakan, dan pilih Semua kolom.

  7. Pilih + untuk menambahkan aturan baru.

  8. Dari menu turun, pilih Kecualikan dan Nama kolom.

  9. Masukkan kerugian yang dinormalisasikan dalam kotak teks.

  10. Di kanan bawah, pilih Simpan untuk menutup pemilih kolom.

    Screenshot of select columns with exclude highlighted.

  11. Pilih komponen Memilih Kolom di Himpunan Data.

  12. Di panel detail komponen di sebelah kanan kanvas, pilih kotak teks Komentar dan masukkan Kecualikan kerugian yang dinormalisasikan.

    Komentar akan muncul di grafik untuk membantu Anda mengatur alur.

Bersihkan data yang hilang

Himpunan data Anda masih memiliki nilai yang hilang setelah Anda menghapus kolom kerugian yang dinormalisasikan. Anda dapat menghapus sisa data yang hilang dengan menggunakan komponen Membersihkan Data yang Hilang.

Tip

Membersihkan nilai yang hilang dari data input adalah prasyarat untuk menggunakan sebagian besar komponen dalam desainer.

  1. Di palet komponen di sebelah kiri kanvas, luaskan bagian Transformasi Data, dan temukan komponen Membersihkan Data yang Hilang.

  2. Seret komponen Membersihkan Data yang Hilang ke kanvas alur. Sambungkan ke komponen Memilih Kolom di Himpunan data.

  3. Pilih komponen Membersihkan Data yang Hilang.

  4. Di panel detail komponen di sebelah kanan kanvas, pilih Edit Kolom.

  5. Di jendela Kolom yang akan dibersihkan yang muncul, luaskan menu turun di samping Sertakan. Pilih, Semua kolom

  6. Pilih Simpan

  7. Di panel detail komponen di sebelah kanan kanvas, pilih Hapus seluruh baris di bawah Mode pembersihan.

  8. Di panel detail komponen di sebelah kanan kanvas, pilih kotak Komentar, dan masukkan Hapus baris nilai yang hilang.

    Alur Anda sekarang akan terlihat seperti ini:

    Screenshot of automobile price data connected to select columns in dataset component, which is connected to clean missing data.

Latih model pembelajaran mesin

Sekarang setelah memiliki komponen untuk memproses data, Anda dapat menyiapkan komponen pelatihan.

Karena Anda ingin memprediksi harga, yang merupakan angka, Anda dapat menggunakan algoritma regresi. Untuk contoh ini, Anda menggunakan model regresi linier.

Pisahkan data

Memisahkan data adalah tugas umum dalam pembelajaran mesin. Anda akan memisahkan data menjadi dua himpunan data terpisah. Satu himpunan data akan melatih model dan yang lain akan menguji seberapa baik model bekerja.

  1. Di palet komponen, luaskan bagian Transformasi Data dan temukan komponen Pisahkan Data.

  2. Seret komponen Data Terpisah ke kanvas alur.

  3. Sambungkan port kiri komponen Membersihkan Data yang Hilang ke komponen Pisahkan Data.

    Penting

    Pastikan bahwa port output kiri Membersihkan Data yang Hilang tersambung ke Data Terpisah. Port kiri berisi data yang dibersihkan. Port kanan berisi data yang dibuang.

  4. Pilih komponen Pisahkan Data.

  5. Di panel detail komponen di sebelah kanan kanvas, atur Pecahan baris di himpunan data output pertama menjadi 0,7.

    Opsi ini membagi 70 persen data untuk melatih model dan 30 persen untuk menguji model. 70 persen himpunan data akan dapat diakses melalui port output sebelah kiri. Data yang tersisa akan tersedia melalui port output sebelah kanan.

  6. Di panel detail komponen di sebelah kanan kanvas, pilih kotak Komentar, dan masukkan Pisahkan himpunan data ke dalam set pelatihan (0,7) dan set pengujian (0,3) .

Latih model

Melatih model dengan memberikan himpunan data yang mencakup harga. Algoritma ini membangun model yang menjelaskan hubungan antara fitur dan harga seperti yang disajikan oleh data pelatihan.

  1. Di palet komponen, luaskan Algoritma Pembelajaran Mesin.

    Opsi ini menampilkan beberapa kategori komponen yang dapat Anda gunakan untuk memulai algoritma pembelajaran.

  2. Pilih Regresi>Regresi linier, dan seret regresi ke kanvas alur.

  3. Di palet komponen, perluas bagian Pelatihan komponen, dan seret modul Melatih Model ke kanvas.

  4. Sambungkan output komponen Regresi linier ke input sebelah kiri komponen Melatih Model.

  5. Sambungkan output data pelatihan (port kiri) komponen Pisahkan Data ke input kanan komponen Melatih Model.

    Penting

    Pastikan bahwa port output kiri Data Terpisah tersambung ke Melatih Model. Port kiri berisi set pelatihan. Porta kanan berisi set pengujian.

    Screenshot showing the Linear Regression connects to left port of Train Model and the Split Data connects to right port of Train Model.

  6. Pilih komponen Melatih Model.

  7. Di panel detail komponen di sebelah kanan kanvas, pilih pemilih Edit kolom.

  8. Dalam kotak dialog Kolom label, luaskan menu turun dan pilih Nama kolom.

  9. Dalam kotak teks, masukkan harga untuk menentukan nilai yang akan diprediksi model Anda.

    Penting

    Pastikan Anda memasukkan nama kolom dengan tepat. Jangan kapitalisasi harga.

    Alur Anda akan terlihat seperti ini:

    Screenshot showing the correct configuration of the pipeline after adding the Train Model component.

Menambahkan komponen Model Skor

Setelah Anda melatih model Anda dengan menggunakan 70 persen data, Anda dapat menggunakan model untuk mencetak 30 persen lainnya untuk melihat seberapa baik fungsi model Anda.

  1. Masukkan model skor di kotak pencarian untuk menemukan komponen Model Skor. Seret komponen ke kanvas alur.

  2. Sambungkan output komponen Melatih Model ke port input kiri Model Skor. Sambungkan output data pengujian (port kanan) komponen Pisahkan Data ke port input kanan Model Skor.

Tambahkan komponen Evaluasi Model

Gunakan komponen Evaluasi Model untuk mengevaluasi seberapa baik model Anda mencetak himpunan data pengujian.

  1. Masukkan evaluasi di kotak pencarian untuk menemukan komponen Evaluasi Model. Seret komponen ke kanvas alur.

  2. Sambungkan output komponen Model Skor ke input kiri Evaluasi Model.

    Alur akhir harus terlihat seperti ini:

    Screenshot showing the correct configuration of the pipeline.

Kirim alur

Sekarang setelah alur disiapkan, Anda dapat mengirimkan eksekusi alur untuk melatih model pembelajaran mesin. Anda dapat mengirimkan eksekusi alur yang valid kapan saja, yang dapat digunakan untuk meninjau perubahan pada alur selama pengembangan.

  1. Di bagian atas kanvas, pilih Kirim.

  2. Dalam kotak dialog Siapkan pekerjaan alur, pilih Buat baru.

    Catatan

    Eksperimen mengelompokkan alur serupa yang berjalan bersamaan. Jika Anda menjalankan alur beberapa kali, Anda dapat memilih eksperimen yang sama untuk eksekusi berturut-turut.

    1. Untuk Nama eksperimen Baru, masukkan Tutorial-CarPrices.

    2. Pilih Kirim.

    3. Anda akan melihat daftar pengiriman di panel kiri kanvas, dan pemberitahuan akan muncul di sudut kanan atas halaman. Anda dapat memilih tautan Detail pekerjaan untuk masuk ke halaman detail pekerjaan untuk penelusuran kesalahan.

      Screenshot of the submitted jobs list with a success notification.

    Jika ini adalah eksekusi pertama, mungkin perlu waktu hingga 20 menit agar alur Anda selesai dijalankan. Pengaturan komputasi default memiliki ukuran simpul minimum 0, yang berarti bahwa perancang harus mengalokasikan sumber daya setelah tidak digunakan. Eksekusi alur berulang akan memakan waktu lebih sedikit karena sumber daya komputasi sudah dialokasikan. Selain itu, perancang menggunakan hasil cache untuk setiap komponen untuk lebih meningkatkan efisiensi.

Lihat label skor

Di halaman detail pekerjaan, Anda dapat memeriksa status pekerjaan alur, hasil, dan log.

Screenshot showing the pipeline job detail page.

Setelah eksekusi selesai, Anda dapat melihat hasil eksekusi alur. Pertama, lihat prediksi yang dihasilkan oleh model regresi.

  1. Klik kanan komponen Beri nilai model, dan pilih Pratinjau data>Himpunan data yang telah dinilai untuk menampilkan outputnya.

    Di sini Anda dapat melihat harga yang diprediksi dan harga aktual dari data pengujian.

    Screenshot of the output visualization highlighting the Scored Label column.

Mengevaluasi model

Gunakan Evaluasi Model untuk melihat seberapa baik model yang dilatih bekerja pada himpunan data pengujian.

  1. Klik kanan komponen Evaluasi Model dan pilih Pratinjau data>Hasil evaluasi untuk menampilkan outputnya.

Statistik berikut ini ditunjukkan untuk model Anda:

  • Rata-rata Kesalahan Absolut (MAE) : Rata-rata kesalahan absolut. Kesalahan adalah perbedaan antara nilai yang diprediksi dan nilai aktual.
  • Kesalahan Kuadrat Rata-rata Akar (RMSE) : Akar kuadrat dari rata-rata kesalahan kuadrat dari prediksi yang dibuat pada himpunan data pengujian.
  • Kesalahan Absolut Relatif: Rata-rata kesalahan absolut relatif terhadap selisih absolut antara nilai aktual dan rata-rata semua nilai aktual.
  • Kesalahan Kuadrat Relatif: Rata-rata kesalahan kuadrat relatif terhadap selisih kuadrat antara nilai aktual dan rata-rata semua nilai aktual.
  • Koefisien Determinasi: Juga disebut sebagai nilai kuadrat R, ini adalah metrik statistik yang menunjukkan seberapa baik model cocok dengan data.

Untuk setiap statistik kesalahan, lebih kecil lebih baik. Nilai yang lebih kecil menunjukkan bahwa prediksi lebih dekat ke nilai aktual. Untuk koefisien determinasi, semakin dekat nilainya ke satu (1,0), semakin baik prediksinya.

Bersihkan sumber daya

Lompati bagian ini jika Anda ingin melanjutkan dengan bagian 2 dari tutorial, menyebarkan model.

Penting

Anda dapat menggunakan sumber daya yang Anda buat sebagai prasyarat untuk tutorial dan artikel cara penggunaan Azure Machine Learning lainnya.

Menghapus semuanya

Jika Anda tidak berencana menggunakan apa pun yang Anda buat, hapus seluruh grup sumber daya agar Anda tidak ditagih biaya apa pun.

  1. Dari portal Microsoft Azure, pilih Grup sumber daya di sebelah kiri jendela.

    Delete resource group in the Azure portal

  2. Dalam daftar, pilih grup sumber daya yang Anda buat.

  3. Pilih Hapus grup sumber daya.

Menghapus grup sumber daya juga menghapus semua sumber daya yang Anda buat daam perancang.

Menghapus aset individu

Di perancang tempat Anda membuat eksperimen, hapus aset individu dengan memilihnya, lalu pilih tombol Hapus.

Target komputasi yang Anda buat di sini secara otomatis diskalakan otomatis ke nol node ketika tidak digunakan. Tindakan ini diambil untuk mengurangi biaya. Jika Anda ingin menghapus target komputasi, lakukan langkah-langkah berikut:

Delete assets

Anda dapat membatalkan pendaftaran himpunan data dari ruang kerja Anda dengan memilih setiap himpunan data dan memilih Batal Pendaftaran.

Unregister dataset

Untuk menghapus himpunan data, buka akun penyimpanan menggunakan portal Microsoft Azure atau Azure Storage Explorer dan hapus aset tersebut secara manual.

Langkah berikutnya

Di bagian dua, Anda akan mempelajari cara menyebarkan model sebagai titik akhir real time.