Mengubah Parameter Tabel Hitungan
Penting
Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.
Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.
- Lihat informasi tentang memindahkan proyek pembelajaran mesin dari ML Studio (klasik) ke Azure Machine Learning.
- Mer informasjon tentang Azure Machine Learning.
ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.
Memodifikasi parameter yang digunakan untuk membuat fitur dari hitungan
Kategori: Pembelajaran dengan Hitungan
Catatan
Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja
Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.
Ringkasan Modul
Artikel ini menjelaskan cara menggunakan modul Ubah Parameter Tabel Hitungan di Pembelajaran Mesin Studio (klasik), untuk mengubah cara fitur dihasilkan dari tabel hitungan.
Secara umum, untuk membuat fitur berbasis hitungan, Anda menggunakan Build Counting Transform untuk memproses himpunan data dan membuat tabel hitungan, dan dari tabel hitungan itu menghasilkan serangkaian fitur baru.
Namun, jika Anda telah membuat tabel hitungan, Anda dapat menggunakan modul Ubah Parameter Tabel Hitungan untuk mengedit definisi bagaimana data hitungan diproses. Ini memungkinkan Anda membuat kumpulan statistik berbasis hitungan yang berbeda berdasarkan data yang ada, tanpa harus menganalisis ulang himpunan data.
Cara mengonfigurasi Ubah Parameter Hitungan
Temukan transformasi yang ingin Anda ubah, di grup Transformasi , dan tambahkan ke eksperimen Anda.
Anda seharusnya sebelumnya menjalankan eksperimen yang menciptakan transformasi hitungan.
Untuk mengubah transformasi yang disimpan: Temukan transformasi, di grup Transformasi , dan tambahkan ke eksperimen Anda.
Untuk memodifikasi transformasi hitungan yang dibuat dalam eksperimen yang sama: Jika transformasi belum disimpan, tetapi tersedia sebagai output dalam eksperimen saat ini (misalnya, periksa output modul Build Counting Transform ), Anda dapat menggunakannya secara langsung dengan menghubungkan modul.
Tambahkan modul Ubah Parameter Tabel Hitungan dan hubungkan transformasi sebagai input.
Di panel Properti modul Ubah Parameter Tabel Hitungan , ketik nilai untuk digunakan sebagai ambang binGarbage.
Nilai ini menentukan jumlah minimum kejadian yang harus ditemukan untuk setiap nilai fitur, agar jumlah yang akan digunakan. Jika frekuensi nilai kurang dari ambang tempat sampah, pasangan label nilai tidak dihitung sebagai item diskrit; sebaliknya, semua item dengan jumlah lebih rendah dari nilai ambang ditempatkan di satu "tempat sampah".
Jika Anda menggunakan dataset kecil dan Anda menghitung dan melatih pada data yang sama, nilai awal yang baik adalah 1.
Untuk Contoh pseudo sebelumnya, ketik angka yang menunjukkan jumlah contoh pseudo tambahan untuk disertakan. Anda tidak perlu memberikan contoh-contoh ini; contoh pseudo dihasilkan berdasarkan distribusi sebelumnya.
Untuk skala kebisingan Laplacian, ketik nilai floating-point positif yang mewakili skala yang digunakan untuk memperkenalkan noise yang diambil sampelnya dari distribusi Laplacian. Ketika Anda menetapkan nilai skala, beberapa tingkat kebisingan yang dapat diterima dimasukkan ke dalam model, sehingga model cenderung tidak terpengaruh oleh nilai data yang tidak terlihat.
Dalam fitur Output termasuk, pilih metode yang akan digunakan saat membuat fitur berbasis hitungan untuk dimasukkan dalam transformasi.
CountsOnly: Buat fitur menggunakan hitungan.
LogOddsOnly: Buat fitur menggunakan log rasio odds.
BothCountsAndLogOdds: Buat fitur menggunakan peluang hitungan dan log.
Pilih opsi Abaikan kembali kolom jika Anda ingin mengganti
IsBackOff
bendera di output saat membuat fitur. Saat Anda memilih opsi ini, fitur berbasis hitungan dibuat meskipun kolom tidak memiliki nilai hitungan yang signifikan.Jalankan eksperimen. Anda kemudian dapat menyimpan output Dari Ubah Parameter Tabel Hitungan sebagai transformasi baru, jika diinginkan.
Contoh
Untuk contoh bagaimana modul ini, lihat Galeri AI Azure:
Pembelajaran dengan Hitungan: Klasifikasi Biner: Menunjukkan cara menggunakan modul pembelajaran dengan hitungan untuk menghasilkan fitur dari kolom nilai kategoris untuk model klasifikasi biner.
Pembelajaran dengan Hitungan: Klasifikasi multiclass dengan data taksi NYC: sampel Menunjukkan cara menggunakan pembelajaran dengan modul hitungan untuk melakukan klasifikasi multiclass pada dataset taksi NYC yang tersedia untuk umum. Sampel menggunakan pelajar regresi logistik multiclass untuk memodelkan masalah ini.
Pembelajaran dengan Hitungan: Klasifikasi biner dengan data taksi NYC: Menunjukkan cara menggunakan modul pembelajaran dengan hitungan untuk melakukan klasifikasi biner pada himpunan data taksi NYC yang tersedia untuk umum. Sampel menggunakan pembelajar regresi logistik dua kelas untuk memodelkan masalah ini.
Catatan teknis
Bagian ini berisi detail implementasi, tips, dan jawaban atas pertanyaan yang sering diajukan.
Secara statistik aman untuk menghitung dan melatih pada kumpulan data yang sama jika Anda mengatur parameter skala kebisingan Laplacian.
Input yang diharapkan
Nama | Jenis | Deskripsi |
---|---|---|
Transformasi penghitungan | Antarmuka ITransform | Transformasi penghitungan untuk diterapkan |
Parameter modul
Nama | Jenis | Rentang | Opsional | Default | Deskripsi |
---|---|---|---|---|---|
Ambang tempat sampah | Mengambang | >=0.0f | Diperlukan | 10.0f | Ambang batas di mana nilai kolom akan featurized terhadap tempat sampah |
Contoh pseudo sebelumnya tambahan | Mengambang | >=0.0f | Diperlukan | 42.0f | Contoh pseudo tambahan setelah distribusi sebelumnya untuk disertakan |
Skala kebisingan Laplacian | Mengambang | >=0.0f | Diperlukan | 0.0f | Skala distribusi Laplacian dari mana kebisingan diambil sampelnya |
Fitur output termasuk | OutputFeatureType | Diperlukan | KeduaCountsAndLogOdds | Fitur untuk output | |
Abaikan kolom mundur | Boolean | Diperlukan | salah | Apakah akan mengabaikan kolom IsBackOff dalam output |
Output
Nama | Jenis | Deskripsi |
---|---|---|
Transformasi yang dimodifikasi | Antarmuka ITransform | Transformasi yang dimodifikasi |
Pengecualian
Pengecualian | Deskripsi |
---|---|
Kesalahan 0003 | Pengecualian terjadi jika satu atau beberapa input null atau kosong. |
Kesalahan 0086 | Pengecualian terjadi ketika transformasi penghitungan tidak valid. |
Untuk daftar kesalahan khusus untuk modul Studio (klasik), lihat Pembelajaran Mesin Kode kesalahan.
Untuk daftar pengecualian API, lihat Pembelajaran Mesin Kode Kesalahan REST API.