Bagikan melalui


Tutorial: Melatih model regresi tanpa kode menggunakan perancang

Penting

Artikel ini memberikan informasi tentang penggunaan Azure Machine Learning SDK v1. SDK v1 tidak digunakan lagi per 31 Maret 2025. Dukungan untuk itu akan berakhir pada 30 Juni 2026. Anda dapat menginstal dan menggunakan SDK v1 hingga tanggal tersebut. Alur kerja Anda yang sudah ada menggunakan SDK v1 akan terus beroperasi setelah tanggal akhir dukungan. Namun, mereka dapat terkena risiko keamanan atau perubahan yang merusak jika terjadi perubahan arsitektur pada produk.

Kami merekomendasikan agar Anda beralih ke SDK v2 sebelum 30 Juni 2026. Untuk informasi selengkapnya tentang SDK v2, lihat Apa itu Azure Machine Learning CLI dan Python SDK v2? dan referensi SDK v2.

Artikel ini menjelaskan cara menggunakan perancang Azure Machine Learning untuk melatih model regresi linier yang memprediksi harga mobil. Tutorial ini adalah bagian pertama dari seri dua bagian.

Untuk mempelajari selengkapnya tentang perancang, lihat Apa itu perancang Azure Machine Learning?

Catatan

Perancang mendukung dua jenis komponen: komponen bawaan klasik (v1) dan komponen kustom (v2). Kedua jenis komponen ini TIDAK kompatibel.

Komponen bawaan klasik ditujukan terutama untuk pemrosesan data dan tugas pembelajaran mesin tradisional seperti regresi dan klasifikasi. Jenis komponen ini terus didukung tetapi tidak akan ada komponen baru yang ditambahkan.

Komponen kustom memungkinkan Anda membungkus kode Anda sendiri sebagai komponen. Ini mendukung berbagi komponen di seluruh ruang kerja dan penulisan tanpa hambatan di seluruh antarmuka Studio, CLI v2, dan SDK v2.

Untuk proyek baru, kami sangat menyarankan Agar Anda menggunakan komponen kustom, yang kompatibel dengan Azure Machine Learning V2 dan akan terus menerima pembaruan baru.

Artikel ini berlaku untuk komponen bawaan klasik dan tidak kompatibel dengan CLI v2 dan SDK v2.

Dalam tutorial ini, Anda akan belajar cara:

  • Membuat alur baru.
  • Impor Data.
  • Siapkan data.
  • Melatih model pembelajaran mesin.
  • Mengevaluasi model pembelajaran mesin.

Di bagian dua tutorial, Anda menyebarkan model Anda sebagai titik akhir inferensi real time untuk memprediksi harga mobil apa pun berdasarkan spesifikasi teknis yang Anda kirimkan.

Catatan

Untuk melihat versi lengkap tutorial ini sebagai alur sampel, lihat Menggunakan regresi untuk memprediksi harga mobil dengan perancang Azure Machine Learning.

Penting

Jika Anda tidak melihat elemen grafis yang disebutkan dalam dokumen ini, seperti tombol di studio atau perancang, Anda mungkin tidak memiliki tingkat izin yang tepat ke ruang kerja. Hubungi administrator langganan Azure Anda untuk memverifikasi bahwa Anda telah diberikan tingkat akses yang benar. Untuk informasi selengkapnya, lihat Mengelola pengguna dan peran.

Membuat alur baru

Alur Azure Machine Learning mengatur beberapa pembelajaran mesin dan langkah-langkah pemrosesan data ke dalam satu sumber daya. Alur memungkinkan Anda mengatur, mengelola, dan menggunakan kembali alur kerja pembelajaran mesin yang kompleks di seluruh proyek dan pengguna.

Untuk membuat alur Azure Machine Learning, Anda memerlukan ruang kerja Azure Machine Learning. Di bagian ini, Anda mempelajari cara membuat kedua sumber daya ini.

Buat ruang kerja baru

Anda memerlukan ruang kerja Azure Machine Learning untuk menggunakan perancang. Ruang kerja adalah sumber daya tingkat teratas untuk Azure Machine Learning. Ini menyediakan tempat terpusat untuk bekerja dengan semua artefak yang Anda buat di Azure Machine Learning. Untuk mempelajari cara membuat ruang kerja, lihat Membuat sumber daya ruang kerja.

Catatan

Jika ruang kerja Anda menggunakan jaringan virtual, ada langkah konfigurasi tambahan yang diperlukan untuk menggunakan perancang. Untuk informasi selengkapnya, lihat Menggunakan studio Azure Machine Learning di jaringan virtual Azure.

Membuat alur

  1. Masuk ke studio Azure Machine Learning, dan pilih ruang kerja yang ingin Anda gunakan.

  2. Pilih Perancang dari menu bilah samping. Di bawah Bawaan klasik, pilih Buat alur baru menggunakan komponen bawaan klasik.

    Cuplikan layar ruang kerja visual memperlihatkan cara mengakses perancang.

  3. Pilih ikon pensil di samping nama draf alur yang dihasilkan secara otomatis, ganti namanya menjadi Prediksi harga mobil. Namanya tidak perlu unik.

    Cuplikan layar ikon pensil untuk mengubah nama draf alur.

Impor data

Ada beberapa himpunan data sampel yang disertakan dalam perancang untuk Anda bereksperimen. Untuk tutorial ini, gunakan Data harga mobil (Mentah).

  1. Di sebelah kiri kanvas alur adalah palet himpunan data dan komponen. Pilih Komponen>Data Sampel.

  2. Pilih himpunan data Data harga mobil (Mentah), dan seret himpunan data ke kanvas.

    Gif menyeret data harga Mobil ke kanvas.

Visualisasikan data

Anda dapat memvisualisasikan data untuk memahami himpunan data yang akan Anda gunakan.

  1. Klik kanan Data harga mobil (Mentah) dan pilih Pratinjau Data.

  2. Pilih kolom yang berbeda di jendela data untuk melihat informasi tentang masing-masing kolom.

    Masing-masing baris mewakili mobil, dan variabel yang terkait dengan setiap mobil muncul sebagai kolom. Ada 205 baris dan 26 kolom dalam himpunan data ini.

Siapkan data

Himpunan data biasanya memerlukan beberapa prapemrosesan sebelum analisis. Anda mungkin telah melihat beberapa nilai yang hilang saat Anda memeriksa himpunan data. Nilai yang hilang ini harus dibersihkan sehingga model dapat menganalisis data dengan benar.

Menghapus kolom

Saat melatih model, Anda harus mengambil tindakan untuk mengatasi data yang hilang. Dalam himpunan data ini, kolom kerugian yang dinormalisasi kehilangan banyak nilai, sehingga Anda mengecualikan kolom tersebut dari model sama sekali.

  1. Di himpunan data dan palet komponen di sebelah kiri kanvas, pilih Komponen dan cari komponen Pilih Kolom di Himpunan Data .

  2. Seret komponen Memilih Kolom di Himpunan Data ke kanvas. Jatuhkan komponen di bawah komponen himpunan data.

  3. Sambungkan himpunan data Data harga mobil (Mentah) ke komponen Memilih Kolom di Himpunan Data. Seret dari port output himpunan data, yang merupakan lingkaran kecil di bagian bawah himpunan data pada kanvas, ke port input Memilih Kolom di Himpunan Data, yang merupakan lingkaran kecil di bagian atas komponen.

    Petunjuk / Saran

    Anda membuat alur data melalui alur Anda ketika menyambungkan port output dari satu komponen ke port input dari yang lain.

    Animasi yang memperlihatkan menyambungkan komponen data harga Mobil untuk memilih kolom dalam komponen himpunan data.

  4. Pilih komponen Memilih Kolom di Himpunan Data.

  5. Pilih ikon panah di bawah Antarmuka alur di sebelah kanan kanvas untuk membuka panel detail komponen. Atau, Anda bisa mengklik ganda komponen Pilih Kolom di Himpunan Data untuk membuka panel detail.

  6. Pilih Edit kolom di sebelah kanan panel.

  7. Luaskan daftar drop-down Nama kolom di samping Sertakan, dan pilih Semua kolom.

  8. Pilih + untuk menambahkan aturan baru.

  9. Dari menu turun, pilih Kecualikan dan Nama kolom.

  10. Masukkan kerugian yang dinormalisasikan dalam kotak teks.

  11. Di kanan bawah, pilih Simpan untuk menutup pemilih kolom.

    Cuplikan layar pilih kolom dengan pengecualian disorot.

  12. Di bagian detail komponen Pilih Kolom dalam Himpunan Data, buka informasi Simpul.

  13. Pilih kotak teks Komentar dan masukkan Kecualikan kerugian yang dinormalisasi.

    Komentar muncul di grafik untuk membantu Anda menata alur Anda.

Bersihkan data yang hilang

Himpunan data Anda masih memiliki nilai yang hilang setelah Anda menghapus kolom kerugian yang dinormalisasikan. Anda dapat menghapus sisa data yang hilang dengan menggunakan komponen Membersihkan Data yang Hilang.

Petunjuk / Saran

Membersihkan nilai yang hilang dari data input adalah prasyarat untuk menggunakan sebagian besar komponen dalam desainer.

  1. Di himpunan data dan palet komponen di sebelah kiri kanvas, pilih Komponen dan cari komponen Bersihkan Data yang Hilang .

  2. Seret komponen Membersihkan Data yang Hilang ke kanvas alur. Sambungkan ke komponen Memilih Kolom di Himpunan data.

  3. Pilih komponen Bersihkan Data yang Hilang.

  4. Pilih ikon panah di bawah Antarmuka alur di sebelah kanan kanvas untuk membuka panel detail komponen. Atau, Anda dapat mengklik dua kali komponen Bersihkan Data yang Hilang untuk membuka panel detail.

  5. Pilih Edit kolom di sebelah kanan panel.

  6. Di jendela Kolom yang akan dibersihkan yang muncul, luaskan menu turun di samping Sertakan. Pilih Semua kolom.

  7. Pilih Simpan.

  8. Di panel Bersihkan detail komponen Data yang Hilang, di bawah Mode pembersihan, pilih Hapus seluruh baris.

  9. Di panel detail komponen Bersihkan Data yang Hilang, perluas Informasi Node.

  10. Pilih kotak teks Komentar dan masukkan Hapus baris nilai yang hilang.

    Alur Anda sekarang akan terlihat seperti ini:

    Cuplikan layar data harga mobil yang tersambung untuk memilih kolom dalam komponen himpunan data, yang tersambung untuk membersihkan data yang hilang.

Melatih model pembelajaran mesin

Sekarang setelah memiliki komponen untuk memproses data, Anda dapat menyiapkan komponen pelatihan.

Karena Anda ingin memprediksi harga, yang merupakan angka, Anda dapat menggunakan algoritma regresi. Untuk contoh ini, Anda menggunakan model regresi linier.

Pisahkan data

Memisahkan data adalah tugas umum dalam pembelajaran mesin. Anda akan memisahkan data menjadi dua himpunan data terpisah. Satu himpunan data melatih model dan yang lain menguji seberapa baik performa model.

  1. Di himpunan data dan palet komponen di sebelah kiri kanvas, pilih Komponen dan cari komponen Pisahkan Data .

  2. Seret komponen Data Terpisah ke kanvas alur.

  3. Sambungkan port kiri komponen Membersihkan Data yang Hilang ke komponen Pisahkan Data.

    Penting

    Pastikan bahwa port output kiri Bersihkan Data yang Hilang tersambung ke Data Terpisah. Port kiri berisi data yang dibersihkan. Port kanan berisi data yang dibuang.

  4. Pilih komponen Pisahkan Data.

  5. Pilih ikon panah di bawah Antarmuka alur di sebelah kanan kanvas untuk membuka panel detail komponen. Atau, Anda dapat mengklik dua kali komponen Pisahkan Data untuk membuka panel detail.

  6. Di panel Detail Data Terpisah , atur Pecahan baris dalam himpunan data output pertama ke 0,7.

    Opsi ini membagi 70 persen data untuk melatih model dan 30 persen untuk menguji model. Himpunan data 70 persen dapat diakses melalui port output kiri. Data yang tersisa tersedia melalui port output yang tepat.

  7. Di panel Data Terpisah, perluas Informasi Simpul.

  8. Pilih kotak teks Komentar dan masukkan Pisahkan himpunan data menjadi set pelatihan (0,7) dan set pengujian (0,3).

Melatih model

Melatih model dengan memberikan himpunan data yang mencakup harga. Algoritma ini membangun model yang menjelaskan hubungan antara fitur dan harga seperti yang disajikan oleh data pelatihan.

  1. Di himpunan data dan palet komponen di sebelah kiri kanvas, pilih Komponen dan cari komponen Regresi Linier .

  2. Seret komponen Regresi Linear ke kanvas alur.

  3. Di himpunan data dan palet komponen di sebelah kiri kanvas, pilih Komponen dan cari komponen Latih Model .

  4. Seret komponen Latih Model ke kanvas alur.

  5. Sambungkan output komponen Regresi linier ke input sebelah kiri komponen Melatih Model.

  6. Sambungkan output data pelatihan (port kiri) komponen Pisahkan Data ke input kanan komponen Melatih Model.

    Penting

    Pastikan bahwa port output kiri Data Terpisah tersambung ke Latih Model. Port kiri berisi set pelatihan. Porta kanan berisi set pengujian.

    Cuplikan layar memperlihatkan Regresi Linier tersambung ke port kiri Latih Model dan Data Terpisah tersambung ke port kanan Latih Model.

  7. Pilih komponen Latih Model.

  8. Pilih ikon panah di bawah Pengaturan alur di sebelah kanan kanvas untuk membuka panel detail komponen. Atau, Anda dapat mengklik dua kali komponen Latih Model untuk membuka panel detail.

  9. Pilih Edit kolom di sebelah kanan panel.

  10. Di jendela Kolom label yang muncul, perluas menu drop-down dan pilih Nama kolom.

  11. Dalam kotak teks, masukkan harga untuk menentukan nilai yang akan diprediksi model Anda.

    Penting

    Pastikan Anda memasukkan nama kolom dengan tepat. Jangan menulis dengan huruf kapital harga.

    Alur Anda akan terlihat seperti ini:

    Cuplikan layar memperlihatkan konfigurasi alur yang benar setelah menambahkan komponen Latih Model.

Menambahkan komponen Model Skor

Setelah Anda melatih model Anda dengan menggunakan 70 persen data, Anda dapat menggunakan model untuk mencetak 30 persen lainnya untuk melihat seberapa baik fungsi model Anda.

  1. Di himpunan data dan palet komponen di sebelah kiri kanvas, pilih Komponen dan cari komponen Model Skor .

  2. Seret komponen Model Skor ke kanvas alur.

  3. Sambungkan output komponen Melatih Model ke port input kiri Model Skor. Sambungkan output data pengujian (port kanan) komponen Pisahkan Data ke port input kanan Model Skor.

Tambahkan komponen Evaluasi Model

Gunakan komponen Evaluasi Model untuk mengevaluasi seberapa baik model Anda mencetak himpunan data pengujian.

  1. Di himpunan data dan palet komponen di sebelah kiri kanvas, pilih Komponen dan cari komponen Evaluasi Model .

  2. Seret komponen Evaluasi Model ke kanvas alur.

  3. Sambungkan output komponen Model Skor ke input kiri Evaluasi Model.

    Alur akhir harus terlihat seperti ini:

    Cuplikan layar memperlihatkan konfigurasi alur yang benar.

Mengirimkan alur

  1. Pilih Konfigurasikan & Kirim di sudut atas untuk mengirimkan alur.

  2. Setelah wizard langkah demi langkah muncul, ikuti panduan tersebut untuk mengirimkan pekerjaan pipeline.

    Cuplikan layar memperlihatkan wizard pengiriman.

    Di Dasar,Anda dapat mengonfigurasi eksperimen, nama tampilan pekerjaan, deskripsi pekerjaan, dll.

    Di Input & Output, Anda dapat menetapkan nilai ke input dan output yang dipromosikan ke tingkat alur. Ini kosong dalam contoh ini karena kami tidak mempromosikan input atau output apa pun ke tingkat pipeline.

    Di Pengaturan runtime, Anda dapat mengonfigurasi datastore default dan komputasi default ke alur. Ini adalah datastore dan komputasi default untuk semua komponen di dalam pipeline. Namun, jika Anda mengatur komputasi atau datastore yang berbeda untuk komponen secara eksplisit, sistem menghormati pengaturan tingkat komponen. Jika tidak, ia menggunakan default.

    Langkah Tinjau + Kirim adalah langkah terakhir untuk meninjau semua pengaturan sebelum mengirimkan. Wizard mengingat konfigurasi terakhir Anda jika Anda pernah mengirimkan alur.

Setelah mengirimkan tugas alur kerja, ada pesan di bagian atas dengan tautan ke rincian tugas. Anda dapat memilih tautan ini untuk meninjau detail pekerjaan.

Cuplikan layar memperlihatkan pesan pengiriman.

Lihat label skor

Di halaman detail pekerjaan, Anda dapat memeriksa status pekerjaan alur, hasil, dan log.

Setelah pekerjaan selesai, Anda dapat melihat hasil pekerjaan alur. Pertama, lihat prediksi yang dihasilkan oleh model regresi.

  1. Klik kanan komponen Beri nilai model, dan pilih Pratinjau data>Himpunan data yang telah dinilai untuk menampilkan outputnya.

    Di sini Anda dapat melihat harga yang diprediksi dan harga aktual dari data pengujian.

    Cuplikan layar visualisasi output yang menyoroti kolom Label Skor.

Mengevaluasi model

Gunakan Evaluasi Model untuk melihat seberapa baik model yang dilatih bekerja pada himpunan data pengujian.

  1. Klik kanan komponen Evaluasi Model dan pilih Pratinjau data>Hasil evaluasi untuk menampilkan outputnya.

Statistik berikut ini ditunjukkan untuk model Anda:

  • Rata-rata Kesalahan Absolut (MAE): Rata-rata kesalahan absolut. Kesalahan adalah perbedaan antara nilai yang diprediksi dan nilai aktual .
  • Kesalahan Kuadrat Rata-rata Akar (RMSE): Akar kuadrat dari rata-rata kesalahan kuadrat dari prediksi yang dibuat pada himpunan data pengujian.
  • Kesalahan Absolut Relatif: Rata-rata kesalahan absolut relatif terhadap selisih absolut antara nilai aktual dan rata-rata semua nilai aktual.
  • Kesalahan Kuadrat Relatif: Rata-rata kesalahan kuadrat relatif terhadap selisih kuadrat antara nilai aktual dan rata-rata semua nilai aktual.
  • Koefisien Determinasi: Juga disebut sebagai nilai kuadrat R, ini adalah metrik statistik yang menunjukkan seberapa baik model cocok dengan data.

Untuk setiap statistik kesalahan, lebih kecil lebih baik. Nilai yang lebih kecil menunjukkan bahwa prediksi lebih dekat ke nilai aktual. Untuk koefisien determinasi, semakin dekat nilainya ke satu (1,0), semakin baik prediksinya.

Membersihkan sumber daya

Lompati bagian ini jika Anda ingin melanjutkan dengan bagian 2 dari tutorial, menyebarkan model.

Penting

Anda dapat menggunakan sumber daya yang Anda buat sebagai prasyarat untuk tutorial dan artikel cara penggunaan Azure Machine Learning lainnya.

Menghapus semuanya

Jika Anda tidak berencana menggunakan apa pun yang Anda buat, hapus seluruh grup sumber daya agar Anda tidak ditagih biaya apa pun.

  1. Di portal Microsoft Azure, pilih Grup sumber daya di bawah layanan Azure.

  2. Pilih grup sumber daya yang Anda buat.

  3. Pilih Hapus grup sumber daya.

    Cuplikan layar yang memperlihatkan tombol untuk menghapus grup sumber daya di portal Microsoft Azure.

Menghapus grup sumber daya juga menghapus semua sumber daya yang Anda buat daam perancang.

Menghapus aset individu

Di perancang tempat Anda membuat eksperimen, hapus aset individu dengan memilihnya, lalu pilih tombol Hapus.

Target komputasi yang Anda buat di sini secara otomatis diskalakan otomatis ke nol node ketika tidak digunakan. Tindakan ini diambil untuk mengurangi biaya. Jika Anda ingin menghapus target komputasi, lakukan langkah-langkah berikut:

Cuplikan layar yang memperlihatkan cara menghapus aset.

Untuk menghapus himpunan data, buka akun penyimpanan menggunakan portal Microsoft Azure atau Azure Storage Explorer dan hapus aset tersebut secara manual.

Langkah selanjutnya

Di bagian dua, Anda akan mempelajari cara menyebarkan model sebagai titik akhir real time.