Bagikan melalui


Pembelajaran Mesin - Skor

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.

Bagian ini mencantumkan modul yang disediakan di Pembelajaran Mesin Studio (klasik) untuk penilaian.

Catatan

Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja

Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.

Scoring juga disebut prediksi, dan merupakan proses menghasilkan nilai berdasarkan model pembelajaran mesin yang terlatih, mengingat beberapa data input baru. Nilai atau skor yang dibuat dapat mewakili prediksi nilai masa depan, tetapi mereka mungkin juga mewakili kategori atau hasil yang mungkin. Arti skor tergantung pada jenis data yang Anda berikan, dan jenis model yang Anda buat.

Membuat dan menggunakan model di Pembelajaran Mesin Studio (klasik)

Alur kerja khas untuk pembelajaran mesin mencakup fase-fase ini:

  • Memilih algoritma yang sesuai, dan mengatur opsi awal.
  • Melatih model pada data yang kompatibel.
  • Membuat prediksi menggunakan data baru, berdasarkan pola dalam model.
  • Mengevaluasi model untuk menentukan apakah prediksi akurat, berapa banyak kesalahan yang ada, dan jika ada overfitting.

Pembelajaran Mesin Studio (klasik) mendukung kerangka kerja yang fleksibel dan dapat disesuaikan untuk pembelajaran mesin. Setiap tugas dalam proses ini dilakukan oleh jenis modul tertentu, yang dapat dimodifikasi, ditambahkan, atau dihapus, tanpa merusak sisa eksperimen Anda.

Modul di bagian ini mencakup alat untuk penilaian. Dalam fase pembelajaran mesin ini, Anda menerapkan model terlatih ke data baru, untuk menghasilkan prediksi. Anda dapat mengirim prediksi tersebut ke aplikasi yang mengkonsumsi hasil pembelajaran mesin, atau menggunakan hasil penilaian untuk mengevaluasi keakuratan dan kegunaan model.

Lebih lanjut tentang scoring

Scoring banyak digunakan dalam pembelajaran mesin untuk berarti proses menghasilkan nilai-nilai baru, diberikan model dan beberapa masukan baru. Istilah generik "skor" digunakan, bukan "prediksi," karena proses penilaian dapat menghasilkan begitu banyak jenis nilai:

  • Daftar item yang direkomendasikan dan skor kesamaan.
  • Nilai numerik, untuk model deret waktu dan model regresi.
  • Nilai probabilitas, menunjukkan kemungkinan bahwa input baru termasuk dalam beberapa kategori yang ada.
  • Nama kategori atau kluster yang paling mirip dengan item baru.
  • Kelas atau hasil yang diprediksi, untuk model klasifikasi.

Catatan

Anda mungkin juga pernah mendengar skor kata yang digunakan untuk berarti berat atau nilai yang ditetapkan sebagai hasil analisis data. Namun, dalam Pembelajaran Mesin Studio (klasik), penilaian biasanya menunjukkan proses menghasilkan nilai yang diprediksi dari data baru.

Saat Anda menambahkan salah satu modul ini dalam eksperimen Anda, Anda harus melampirkan model pembelajaran mesin yang sudah terlatih, dan beberapa data baru. Saat Anda menjalankan eksperimen atau modul yang dipilih, modul penilaian menelan data baru, menghitung skor berdasarkan model, dan mengembalikan skor dalam tabel.

Data yang digunakan untuk penilaian

Data baru yang Anda berikan sebagai input umumnya perlu memiliki kolom yang sama yang digunakan untuk melatih model, dikurangi label, atau kolom hasil.

Kolom yang digunakan semata-mata sebagai pengidentifikasi biasanya dikecualikan saat melatih model, dan dengan demikian harus dikecualikan saat mencetak gol juga. Namun, pengidentifikasi seperti kunci utama dapat dengan mudah digabungkan kembali dengan himpunan data penilaian nanti, dengan menggunakan modul Tambahkan Kolom . Modul ini berfungsi tanpa Anda harus menentukan kunci gabungan, selama ukuran himpunan data tidak berubah.

Sebelum Anda melakukan penilaian pada himpunan data Anda, selalu periksa nilai dan null yang hilang. Ketika data yang digunakan sebagai input untuk penilaian memiliki nilai yang hilang, nilai yang hilang digunakan sebagai input. Karena null diperbanyak, hasilnya biasanya merupakan nilai yang hilang.

Daftar modul penilaian

Pembelajaran Mesin Studio (klasik) menyediakan banyak modul penilaian yang berbeda. Anda memilih salah satu tergantung pada jenis model yang Anda gunakan, atau jenis tugas penilaian yang Anda lakukan:

  • Menerapkan Transformasi: Menerapkan transformasi data yang ditentukan dengan baik ke himpunan data.

    Gunakan modul ini untuk menerapkan proses tersimpan ke sekumpulan data.

  • Tetapkan Data ke Kluster: Menetapkan data ke kluster dengan menggunakan model pengelompokan terlatih yang ada.

    Gunakan modul ini jika Anda ingin mengelompokkan data baru berdasarkan model pengelompokan K-Means yang ada.

    Modul ini menggantikan modul Tetapkan ke Kluster (usang), yang telah tidak digunakan lagi tetapi masih tersedia untuk digunakan dalam eksperimen yang ada.

  • Score Matchbox Recommender: Skor prediksi untuk dataset dengan menggunakan rekomendasi Matchbox.

    Gunakan modul ini jika Anda ingin menghasilkan rekomendasi, menemukan item atau pengguna terkait, atau memprediksi peringkat.

  • Model Skor: Prediksi skor untuk klasifikasi terlatih atau model regresi.

    Gunakan modul ini untuk semua model regresi dan klasifikasi lainnya, serta beberapa model deteksi anomali.

  • Modul penilaian khusus disediakan untuk Vowpal Wabbit. Lihat Analiză text.
  • Anda dapat mencetak gol untuk kelas gambar khusus pada model yang telah dilatih sebelumnya dengan menggunakan Perpustakaan OpenCV.
  • Modul Deteksi Anomali Deret Waktu menghasilkan skor yang mewakili potensi penyimpangan dari suatu tren.

Contoh

Contoh-contoh ini di Azure AI Gallery menunjukkan proses penilaian, dari skenario dasar hingga lanjutan:

Artikel berikut memberikan contoh dunia nyata tentang bagaimana Anda dapat menggunakan model pembelajaran mesin untuk penilaian:

Lihat juga