Bagikan melalui


Tutorial: Melatih model klasifikasi dengan AutoML tanpa kode di studio Azure Machine Learning

Dalam tutorial ini, Anda mempelajari cara melatih model klasifikasi dengan pembelajaran mesin otomatis tanpa kode (AutoML) menggunakan Azure Pembelajaran Mesin di studio Azure Pembelajaran Mesin. Model klasifikasi ini memprediksi apakah klien berlangganan deposito berjangka tetap dengan lembaga keuangan.

Dengan ML Otomatis, Anda dapat mengotomatiskan tugas intensif waktu habis. Pembelajaran mesin otomatis dengan cepat mengulangi banyak kombinasi algoritme dan hiperparameter untuk membantu Anda menemukan model terbaik berdasarkan metrik keberhasilan yang Anda pilih.

Anda tidak menulis kode apa pun dalam tutorial ini. Anda menggunakan antarmuka studio untuk melakukan pelatihan. Anda mempelajari cara melakukan tugas berikut:

  • Membuat ruang kerja Pembelajaran Mesin Microsoft Azure
  • Menjalankan eksperimen pembelajaran mesin otomatis
  • Menjelajahi detail model
  • Menyebarkan model yang direkomendasikan

Prasyarat

  • Langganan Azure. Jika Anda tidak memiliki langganan Azure, buat akun gratis.

  • Unduh file data bankmarketing_train.csv. Kolom y menunjukkan jika pelanggan berlangganan deposito berjangka tetap, yang kemudian diidentifikasi sebagai kolom target untuk prediksi dalam tutorial ini.

    Catatan

    Himpunan data Pemasaran Bank ini tersedia di bawah Lisensi Creative Commons (CCO: Domain Publik). Setiap hak dalam konten individual database dilisensikan di bawah Lisensi Konten Database dan tersedia di Kaggle. Himpunan data ini awalnya tersedia dalam Database Azure Machine Learning UCI.

    [Moro dkk., 2014] S. Moro, P. Cortez dan P. Rita. Pendekatan Berbasis Data untuk Memprediksi Keberhasilan Telemarketing Bank. Sistem Dukungan Keputusan, Elsevier, 62:22-31, Juni 2014.

Membuat ruang kerja

Ruang kerja Azure Machine Learning adalah sumber daya dasar di cloud yang Anda gunakan untuk melakukan eksperimen, melatih, dan menyebarkan model pembelajaran mesin. Hal ini mengikat langganan Azure dan grup sumber daya Anda dengan objek yang mudah dikonsumsi dalam layanan.

Selesaikan langkah-langkah berikut untuk membuat ruang kerja dan lanjutkan tutorial.

  1. Masuk ke Studio Azure Machine Learning.

  2. Pilih Buat ruang kerja.

  3. Berikan informasi berikut untuk mengonfigurasi ruang kerja baru Anda:

    Bidang Deskripsi
    Nama ruang kerja Masukkan nama unik yang mengidentifikasi ruang kerja Anda. Tidak boleh ada ruang kerja dengan nama yang sama di seluruh grup sumber daya. Gunakan nama yang mudah ingat dan berbeda dengan ruang kerja yang dibuat oleh orang lain. Nama ruang kerja tidak peka huruf besar/kecil.
    Langganan Pilih langganan Azure yang ingin Anda gunakan.
    Grup sumber daya Gunakan grup sumber daya yang sudah ada di langganan Anda atau masukkan nama untuk membuat grup sumber daya baru. Grup sumber daya menyimpan sumber daya terkait untuk solusi Azure. Anda memerlukan peran kontributor atau pemilik untuk menggunakan grup sumber daya yang ada. Untuk informasi selengkapnya, lihat Mengelola akses ke ruang kerja Azure Machine Learning.
    Wilayah Pilih wilayah Azure terdekat dengan pengguna dan sumber daya data untuk membuat ruang kerja Anda.
  4. Pilih Buat untuk membuat ruang kerja.

Untuk informasi selengkapnya tentang sumber daya Azure, lihat Membuat ruang kerja.

Untuk cara lain membuat ruang kerja di Azure, Kelola ruang kerja Azure Pembelajaran Mesin di portal atau dengan Python SDK (v2).

Membuat pekerjaan Pembelajaran Mesin Otomatis

Selesaikan penyetelan eksperimen berikut dan jalankan langkah-langkah dengan menggunakan studio Azure Pembelajaran Mesin di https://ml.azure.com. Pembelajaran Mesin Studio adalah antarmuka web terkonsolidasi yang mencakup alat pembelajaran mesin untuk melakukan skenario ilmu data bagi praktisi ilmu data dari semua tingkat keterampilan. Studio tidak didukung pada browser Internet Explorer.

  1. Pilih langganan dan ruang kerja yang Anda buat.

  2. Di panel navigasi, pilih Penulisan>ML Otomatis.

    Karena tutorial ini adalah eksperimen ML otomatis pertama Anda, Anda akan melihat daftar kosong dan tautan ke dokumentasi.

    Cuplikan layar memperlihatkan halaman ML Otomatis tempat Anda dapat membuat pekerjaan ML Otomatis baru.

  3. Pilih Pekerjaan ML Otomatis Baru.

  4. Di Metode pelatihan, pilih Latih secara otomatis, lalu pilih Mulai mengonfigurasi pekerjaan.

  5. Di Pengaturan dasar, pilih Buat baru, lalu untuk Nama eksperimen, masukkan my-1st-automl-experiment.

  6. Pilih Berikutnya untuk memuat himpunan data Anda.

Membuat dan memuat himpunan data sebagai aset data

Sebelum mengonfigurasi eksperimen, unggah file data ke ruang kerja Anda dalam bentuk aset data Azure Pembelajaran Mesin. Untuk tutorial ini, Anda dapat menganggap aset data sebagai himpunan data Anda untuk pekerjaan ML Otomatis. Melakukannya memungkinkan Anda memastikan bahwa data Anda diformat dengan tepat untuk eksperimen Anda.

  1. Di Jenis tugas & data, untuk Pilih jenis tugas, pilih Klasifikasi.

  2. Di bawah Pilih data, pilih Buat.

    1. Dalam formulir Jenis data, beri nama aset data Anda dan berikan deskripsi opsional.

    2. Untuk Jenis, pilih Tabular. Antarmuka ML otomatis saat ini hanya mendukung TabularDatasets.

    3. Pilih Selanjutnya.

    4. Dalam formulir Sumber data, pilih Dari file lokal. Pilih Selanjutnya.

    5. Di Jenis penyimpanan tujuan, pilih datastore default yang disiapkan secara otomatis selama pembuatan ruang kerja Anda: workspaceblobstore. Anda mengunggah file data ke lokasi ini untuk membuatnya tersedia di ruang kerja Anda.

    6. Pilih Selanjutnya.

    7. Di Pilihan file atau folder, pilih Unggah file atau folder>Unggah file.

    8. Pilih file bankmarketing_train.csv pada komputer lokal Anda. Anda mengunduh file ini sebagai prasyarat.

    9. Pilih Selanjutnya.

      Setelah unggahan selesai, area Pratinjau data diisi berdasarkan jenis file.

    10. Dalam formulir Pengaturan, tinjau nilai untuk data Anda. Kemudian pilih Berikutnya.

      Bidang Deskripsi Nilai untuk tutorial
      Format file Menentukan tata letak dan jenis data yang disimpan dalam sebuah file. Berbatas
      Pemisah Satu atau beberapa karakter untuk menentukan batas antara, wilayah independen yang terpisah dalam teks biasa atau aliran data lainnya. Koma
      Pengodean Mengidentifikasi bit ke tabel skema karakter apa yang akan digunakan untuk membaca himpunan data Anda. UTF-8
      Header kolom Menunjukkan bagaimana header himpunan data, jika ada, diperlakukan. Semua file memiliki header yang sama
      Lewati baris Menunjukkan berapa banyak, jika ada, baris yang dilewati dalam himpunan data. Tidak
    11. Formulir Skema memungkinkan konfigurasi data Anda lebih lanjut untuk eksperimen ini. Untuk contoh ini, pilih sakelar pengalih untuk day_of_week, agar tidak menyertakannya. Pilih Selanjutnya.

      Cuplikan layar memperlihatkan formulir Skema tempat Anda dapat menjalankan kolom dari data Anda.

    12. Dalam formulir Tinjau, verifikasi informasi Anda, lalu pilih Buat.

  3. Pilih himpunan data Anda dari daftar.

  4. Tinjau data dengan memilih aset data dan lihat tab pratinjau . Pastikan data tidak menyertakan day_of_week dan pilih Tutup.

  5. Pilih Berikutnya untuk melanjutkan ke pengaturan tugas.

Mengonfigurasi pekerjaan

Setelah memuat dan mengonfigurasi data, Anda dapat menyiapkan eksperimen. Penyetelan ini mencakup tugas desain eksperimen seperti, memilih ukuran lingkungan komputasi Anda dan menentukan kolom apa yang ingin Anda prediksi.

  1. Isi formulir Pengaturan tugas sebagai berikut:

    1. Pilih y (String) sebagai kolom target, yang ingin Anda prediksi. Kolom ini menunjukkan apakah klien berlangganan deposito berjangka atau tidak.

    2. Pilih Tampilkan pengaturan konfigurasi tambahan dan isi bidang sebagai berikut. Pengaturan ini untuk mengontrol pekerjaan pelatihan dengan lebih baik. Jika tidak, pengaturan default diterapkan berdasarkan pilihan eksperimen dan data.

      Konfigurasi tambahan Deskripsi Nilai untuk tutorial
      Metrik utama Metrik evaluasi yang digunakan untuk mengukur algoritma pembelajaran mesin. AUCWeighted
      Menjelaskan model terbaik Secara otomatis menunjukkan kemampuan menjelaskan pada model terbaik yang dibuat oleh Pembelajaran Mesin otomatis. Aktifkan
      Model yang diblokir Algoritma yang ingin Anda kecualikan dari pekerjaan pelatihan Tidak
    3. Pilih Simpan.

  2. Di bawah Validasi dan uji:

    1. Untuk Jenis validasi, pilih validasi silang k-fold.
    2. Untuk Jumlah validasi silang, pilih 2.
  3. Pilih Selanjutnya.

  4. Pilih kluster komputasi sebagai jenis komputasi Anda.

    Target komputasi adalah lingkungan sumber daya lokal atau berbasis cloud yang digunakan untuk menjalankan skrip pelatihan Anda atau menghosting penyebaran layanan Anda. Untuk eksperimen ini, Anda dapat mencoba komputasi tanpa server berbasis cloud (pratinjau) atau membuat komputasi berbasis cloud Anda sendiri.

    Catatan

    Untuk menggunakan komputasi tanpa server, aktifkan fitur pratinjau, pilih Tanpa Server, dan lewati prosedur ini.

  5. Untuk membuat target komputasi Anda sendiri, di Pilih jenis komputasi, pilih Kluster komputasi untuk mengonfigurasi target komputasi Anda.

  6. Isi formulir Komputer Virtual untuk menyiapkan komputasi Anda. Pilih baru.

    Bidang Deskripsi Nilai untuk tutorial
    Lokasi Wilayah tempat Anda ingin menjalankan mesin US Barat 2
    Tingkat mesin virtual Pilih prioritas yang harus dimiliki eksperimen Anda Khusus
    Jenis komputer virtual Pilih jenis komputer virtual untuk komputasi Anda. CPU (Unit Pemrosesan Pusat)
    Ukuran komputer virtual Pilih jenis komputer virtual untuk komputasi Anda. Daftar ukuran yang direkomendasikan diberikan berdasarkan data dan jenis eksperimen Anda. Standard_DS12_V2
  7. Pilih Berikutnya untuk masuk ke formulir Pengaturan Tingkat Lanjut.

    Cuplikan layar memperlihatkan halaman Pengaturan Tingkat Lanjut, tempat Anda memasukkan nilai untuk kluster komputasi Anda.

    Bidang Deskripsi Nilai untuk tutorial
    Nama komputasi Nama unik yang mengidentifikasi konteks komputasi Anda. automl-compute
    Node Min/Maks Untuk data profil, Anda harus menetapkan 1 atau beberapa Simpul. Node minimal: 1
    Node maksimal: 6
    Detik siaga menurunkan skala Waktu siaga sebelum kluster secara otomatis diturunkan skalanya ke jumlah node minimum. 120 (default)
    Pengaturan tingkat lanjut Pengaturan untuk mengonfigurasi dan mengotorisasi jaringan virtual untuk eksperimen Anda. Tidak
  8. Pilih Buat.

    Membuat komputasi dapat memakan waktu beberapa menit untuk diselesaikan.

  9. Setelah pembuatan, pilih target komputasi baru Anda dari daftar. Pilih Selanjutnya.

  10. Pilih Kirim pekerjaan pelatihan untuk menjalankan eksperimen. Layar Gambaran Umum terbuka dengan Status di bagian atas saat persiapan eksperimen dimulai. Status ini diperbarui saat eksperimen berlangsung. Pemberitahuan juga muncul di studio untuk memberi tahu Anda tentang status eksperimen Anda.

Penting

Persiapan membutuhkan waktu 10-15 menit untuk mempersiapkan eksekusi eksperimen. Setelah dijalankan, hal ini membutuhkan waktu 2-3 menit lebih lama untuk masing-masing iterasi.

Selama proses produksi, Anda mungkin akan menunggu sebentar. Tetapi untuk tutorial ini, Anda dapat mulai menjelajahi algoritma yang diuji pada tab Model saat selesai sementara yang lain terus berjalan.

Menjelajahi model

Navigasi ke tab Model + pekerjaan anak untuk melihat algoritma (model) yang diuji. Secara default, pekerjaan memesan model berdasarkan skor metrik saat selesai. Untuk tutorial ini, model yang mencetak skor tertinggi berdasarkan metrik AUCWeighted yang dipilih berada di bagian atas daftar.

Sambil menunggu semua model eksperimen selesai, pilih Nama algoritma model yang sudah selesai guna mengeksplorasi detail performanya. Pilih gambaran umum dan tab Metrik untuk informasi tentang pekerjaan tersebut.

Animasi berikut menampilkan properti, metrik, dan bagan performa model yang dipilih.

Animasi yang memperlihatkan tampilan berbeda yang tersedia untuk pekerjaan anak.

Lihat penjelasan model

Sambil menunggu model selesai, Anda juga dapat melihat penjelasan model dan melihat fitur data mana (mentah atau direkayasa) yang memengaruhi prediksi model tertentu.

Penjelasan model ini dapat dihasilkan sesuai permintaan. Dasbor penjelasan model yang menjadi bagian dari tab Penjelasan (pratinjau) meringkas penjelasan ini.

Untuk menghasilkan penjelasan model:

  1. Di tautan navigasi di bagian atas halaman, pilih nama pekerjaan untuk kembali ke layar Model .

  2. Pilih tab Model + pekerjaan anak.

  3. Untuk tutorial ini, pilih model MaxAbsScaler, LightGBM pertama.

  4. Pilih Jelaskan model. Di sebelah kanan, panel Jelaskan model muncul.

  5. Pilih jenis komputasi Anda lalu pilih instans atau kluster: automl-compute yang Anda buat sebelumnya. Komputasi ini memulai pekerjaan anak untuk menghasilkan penjelasan model.

  6. Pilih Buat. Pesan keberhasilan hijau muncul.

    Catatan

    Pekerjaan yang dapat dijelaskan membutuhkan waktu sekitar 2-5 menit untuk diselesaikan.

  7. Pilih Penjelasan (pratinjau). Tab ini terisi setelah proses penjelasan selesai.

  8. Di sebelah kiri, perluas panel. Di bawah Fitur, pilih baris yang berbuah mentah.

  9. Pilih tab Kepentingan fitur agregat. Bagan ini menunjukkan fitur data mana yang memengaruhi prediksi model yang dipilih.

    Cuplikan layar memperlihatkan dasbor penjelasan Model, menampilkan bagan kepentingan fitur agregat.

    Dalam contoh ini, durasi tampaknya memiliki pengaruh paling besar pada prediksi model ini.

Menyebarkan model terbaik

Antarmuka pembelajaran mesin otomatis memungkinkan Anda untuk menyebarkan model terbaik sebagai layanan web. Penyebaran adalah integrasi model sehingga dapat memprediksi data baru dan mengidentifikasi area peluang potensial. Untuk percobaan ini, penyebaran ke layanan web berarti bahwa lembaga keuangan sekarang memiliki solusi web yang berulang dan terukur untuk mengidentifikasi calon nasabah deposito berjangka tetap.

Periksa untuk melihat apakah eksekusi eksperimen Anda selesai. Untuk melakukannya, navigasikan kembali ke halaman pekerjaan induk dengan memilih nama pekerjaan di bagian atas layar Anda. Status Selesai ditampilkan di kiri atas layar.

Setelah eksekusi eksperimen selesai, halaman Detail diisi dengan bagian Ringkasan model terbaik. Dalam konteks eksperimen ini, VotingEnsemble dianggap sebagai model terbaik, berdasarkan metrik AUCWeighted .

Sebarkan model ini. Penyebaran membutuhkan waktu sekitar 20 menit untuk diselesaikan. Proses penyebaran memerlukan beberapa langkah termasuk mendaftarkan model, membuat sumber daya, dan mengonfigurasikan penyebaran untuk layanan web.

  1. Pilih VotingEnsemble untuk membuka halaman khusus model.

  2. Pilih Sebarkan>layanan Web.

  3. Isi panel Sebarkan model sebagai berikut:

    Bidang Nilai
    Nama my-automl-deploy
    Deskripsi Penyebaran eksperimen pembelajaran mesin otomatis pertama saya
    Tipe komputasi Pilih Azure Container Instance
    Aktifkan autentikasi Nonaktifkan.
    Gunakan aset penyebaran kustom Nonaktifkan. Memungkinkan file driver default (skrip penilaian) dan file lingkungan dibuat secara otomatis.

    Untuk contoh ini, gunakan default yang disediakan di menu Tingkat Lanjut .

  4. Pilih Sebarkan.

    Pesan keberhasilan hijau muncul di bagian atas layar Pekerjaan . Di panel Ringkasan model, pesan status muncul di bawah Status penyebaran. Pilih Refresh secara berkala untuk memeriksa status penyebaran.

Anda memiliki layanan web operasional untuk menghasilkan prediksi.

Lanjutkan ke konten Terkait untuk mempelajari selengkapnya tentang cara menggunakan layanan web baru Anda, dan menguji prediksi Anda menggunakan Power BI yang dibangun di dukungan Azure Pembelajaran Mesin.

Membersihkan sumber daya

File penyebaran lebih besar dari file data dan eksperimen, sehingga harga file lebih mahal untuk disimpan. Jika Anda ingin menyimpan ruang kerja dan file eksperimen, hapus hanya file penyebaran untuk meminimalkan biaya ke akun Anda. Jika Anda tidak berencana untuk menggunakan salah satu file, hapus seluruh grup sumber daya.

Hapus instans penyebaran

Hapus hanya instans penyebaran dari Azure Pembelajaran Mesin dihttps://ml.azure.com/.

  1. Buka Azure Machine Learning. Navigasi ke ruang kerja Anda dan di bawah panel Aset , pilih Titik Akhir.

  2. Pilih penyebaran yang ingin Anda hapus dan pilih Hapus.

  3. Pilih Lanjutkan.

Hapus grup sumber daya

Penting

Sumber daya yang Anda buat sebagai prasyarat untuk tutorial dan artikel cara penggunaan Azure Machine Learning lainnya.

Jika Anda tidak berencana menggunakan sumber daya yang sudah Anda buat, hapus sehingga Anda tidak dikenakan biaya apa pun:

  1. Di portal Azure, di kotak pencarian, masukkan Grup sumber daya dan pilih dari hasil.

  2. Dari daftar, pilih grup sumber daya yang Anda buat.

  3. Di halaman Gambaran Umum , pilih Hapus grup sumber daya.

    Cuplikan layar pilihan untuk menghapus grup sumber daya di portal Microsoft Azure.

  4. Masukkan nama grup sumber daya. Kemudian pilih Hapus.

Dalam tutorial pembelajaran mesin otomatis ini, Anda menggunakan antarmuka Pembelajaran Mesin otomatis Azure Machine Learning untuk membuat dan menyebarkan model klasifikasi. Untuk informasi selengkapnya dan langkah berikutnya, lihat sumber daya ini:

Coba juga pembelajaran mesin otomatis untuk jenis model lain berikut: