Bagikan melalui


Mengubah Parameter Tabel Hitungan

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.

Memodifikasi parameter yang digunakan untuk membuat fitur dari hitungan

Kategori: Pembelajaran dengan Hitungan

Catatan

Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja

Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.

Ringkasan Modul

Artikel ini menjelaskan cara menggunakan modul Ubah Parameter Tabel Hitungan di Pembelajaran Mesin Studio (klasik), untuk mengubah cara fitur dihasilkan dari tabel hitungan.

Secara umum, untuk membuat fitur berbasis hitungan, Anda menggunakan Build Counting Transform untuk memproses himpunan data dan membuat tabel hitungan, dan dari tabel hitungan itu menghasilkan serangkaian fitur baru.

Namun, jika Anda telah membuat tabel hitungan, Anda dapat menggunakan modul Ubah Parameter Tabel Hitungan untuk mengedit definisi bagaimana data hitungan diproses. Ini memungkinkan Anda membuat kumpulan statistik berbasis hitungan yang berbeda berdasarkan data yang ada, tanpa harus menganalisis ulang himpunan data.

Cara mengonfigurasi Ubah Parameter Hitungan

  1. Temukan transformasi yang ingin Anda ubah, di grup Transformasi , dan tambahkan ke eksperimen Anda.

    Anda seharusnya sebelumnya menjalankan eksperimen yang menciptakan transformasi hitungan.

    • Untuk mengubah transformasi yang disimpan: Temukan transformasi, di grup Transformasi , dan tambahkan ke eksperimen Anda.

    • Untuk memodifikasi transformasi hitungan yang dibuat dalam eksperimen yang sama: Jika transformasi belum disimpan, tetapi tersedia sebagai output dalam eksperimen saat ini (misalnya, periksa output modul Build Counting Transform ), Anda dapat menggunakannya secara langsung dengan menghubungkan modul.

  2. Tambahkan modul Ubah Parameter Tabel Hitungan dan hubungkan transformasi sebagai input.

  3. Di panel Properti modul Ubah Parameter Tabel Hitungan , ketik nilai untuk digunakan sebagai ambang binGarbage.

    Nilai ini menentukan jumlah minimum kejadian yang harus ditemukan untuk setiap nilai fitur, agar jumlah yang akan digunakan. Jika frekuensi nilai kurang dari ambang tempat sampah, pasangan label nilai tidak dihitung sebagai item diskrit; sebaliknya, semua item dengan jumlah lebih rendah dari nilai ambang ditempatkan di satu "tempat sampah".

    Jika Anda menggunakan dataset kecil dan Anda menghitung dan melatih pada data yang sama, nilai awal yang baik adalah 1.

  4. Untuk Contoh pseudo sebelumnya, ketik angka yang menunjukkan jumlah contoh pseudo tambahan untuk disertakan. Anda tidak perlu memberikan contoh-contoh ini; contoh pseudo dihasilkan berdasarkan distribusi sebelumnya.

  5. Untuk skala kebisingan Laplacian, ketik nilai floating-point positif yang mewakili skala yang digunakan untuk memperkenalkan noise yang diambil sampelnya dari distribusi Laplacian. Ketika Anda menetapkan nilai skala, beberapa tingkat kebisingan yang dapat diterima dimasukkan ke dalam model, sehingga model cenderung tidak terpengaruh oleh nilai data yang tidak terlihat.

  6. Dalam fitur Output termasuk, pilih metode yang akan digunakan saat membuat fitur berbasis hitungan untuk dimasukkan dalam transformasi.

    • CountsOnly: Buat fitur menggunakan hitungan.

    • LogOddsOnly: Buat fitur menggunakan log rasio odds.

    • BothCountsAndLogOdds: Buat fitur menggunakan peluang hitungan dan log.

  7. Pilih opsi Abaikan kembali kolom jika Anda ingin mengganti IsBackOff bendera di output saat membuat fitur. Saat Anda memilih opsi ini, fitur berbasis hitungan dibuat meskipun kolom tidak memiliki nilai hitungan yang signifikan.

  8. Jalankan eksperimen. Anda kemudian dapat menyimpan output Dari Ubah Parameter Tabel Hitungan sebagai transformasi baru, jika diinginkan.

Contoh

Untuk contoh bagaimana modul ini, lihat Galeri AI Azure:

Catatan teknis

Bagian ini berisi detail implementasi, tips, dan jawaban atas pertanyaan yang sering diajukan.

Secara statistik aman untuk menghitung dan melatih pada kumpulan data yang sama jika Anda mengatur parameter skala kebisingan Laplacian.

Input yang diharapkan

Nama Jenis Deskripsi
Transformasi penghitungan Antarmuka ITransform Transformasi penghitungan untuk diterapkan

Parameter modul

Nama Jenis Rentang Opsional Default Deskripsi
Ambang tempat sampah Mengambang >=0.0f Diperlukan 10.0f Ambang batas di mana nilai kolom akan featurized terhadap tempat sampah
Contoh pseudo sebelumnya tambahan Mengambang >=0.0f Diperlukan 42.0f Contoh pseudo tambahan setelah distribusi sebelumnya untuk disertakan
Skala kebisingan Laplacian Mengambang >=0.0f Diperlukan 0.0f Skala distribusi Laplacian dari mana kebisingan diambil sampelnya
Fitur output termasuk OutputFeatureType Diperlukan KeduaCountsAndLogOdds Fitur untuk output
Abaikan kolom mundur Boolean Diperlukan salah Apakah akan mengabaikan kolom IsBackOff dalam output

Output

Nama Jenis Deskripsi
Transformasi yang dimodifikasi Antarmuka ITransform Transformasi yang dimodifikasi

Pengecualian

Pengecualian Deskripsi
Kesalahan 0003 Pengecualian terjadi jika satu atau beberapa input null atau kosong.
Kesalahan 0086 Pengecualian terjadi ketika transformasi penghitungan tidak valid.

Untuk daftar kesalahan khusus untuk modul Studio (klasik), lihat Pembelajaran Mesin Kode kesalahan.

Untuk daftar pengecualian API, lihat Pembelajaran Mesin Kode Kesalahan REST API.

Lihat juga

Pembelajaran dengan Hitungan