Gabungkan Transformasi Jumlah
Penting
Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.
Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.
- Lihat informasi tentang memindahkan proyek pembelajaran mesin dari ML Studio (klasik) ke Azure Machine Learning.
- Mer informasjon tentang Azure Machine Learning.
ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.
Membuat serangkaian fitur berdasarkan tabel hitungan
Kategori: Pembelajaran dengan Hitungan
Catatan
Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja
Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.
Ringkasan Modul
Artikel ini menjelaskan cara menggunakan modul Merge Count Transform di Pembelajaran Mesin Studio (klasik), untuk menggabungkan dua set fitur berbasis hitungan. Dengan menggabungkan dua set jumlah dan fitur terkait, Anda berpotensi meningkatkan cakupan dan distribusi fitur.
Pembelajaran dari hitungan sangat berguna dalam kumpulan data besar dengan fitur kardinalitas tinggi. Kemampuan untuk menggabungkan beberapa dataset ke dalam kumpulan fitur berbasis hitungan tanpa harus memproses ulang dataset membuatnya lebih mudah untuk mengumpulkan statistik pada dataset yang sangat besar dan menerapkannya ke dataset baru. Misalnya, tabel hitungan dapat digunakan untuk mengumpulkan informasi melalui terabyte data. Anda dapat menggunakan kembali statistik tersebut untuk meningkatkan akurasi model prediktif pada kumpulan data kecil.
Untuk menggabungkan dua set fitur berbasis hitungan, fitur harus dibuat menggunakan tabel yang memiliki skema yang sama: yaitu, kedua set harus menggunakan kolom yang sama, dan memiliki nama dan tipe data yang sama.
Cara mengonfigurasi Transformasi Jumlah Gabungan
Untuk menggunakan Merge Count Transform, Anda harus telah membuat setidaknya satu transformasi berbasis hitungan, dan transformasi itu harus ada di ruang kerja Anda. Jika Anda menyimpan transformasi berbasis hitungan dari eksperimen yang berbeda, lihat di grup Transformasi . Jika Anda membuat transformasi dalam eksperimen saat ini, hubungkan output modul berikut:
Bangun Transformasi Penghitungan. Membuat transformasi berbasis hitungan baru dari data sumber.
Ubah Parameter Tabel Hitungan. Mengambil transformasi hitungan yang ada sebagai input dan menghasilkan transformasi yang diperbarui.
Tabel Hitung Impor. Modul ini mendukung kompatibilitas ke belakang dengan eksperimen lama yang menggunakan pembelajaran berbasis hitungan. Jika Anda menggunakan Tabel Hitung Impor untuk menganalisis distribusi nilai dalam himpunan data, lalu mengonversi nilai menjadi fitur menggunakan modul Count Featurizer yang tidak digunakan lagi, gunakan Tabel Hitung Impor untuk mengonversi hasilnya menjadi transformasi.
Tambahkan modul Gabungkan Jumlah Transformasi ke eksperimen, dan hubungkan transformasi ke setiap input.
Tip
Transformasi kedua adalah input opsional - Anda dapat menghubungkan transformasi yang sama dua kali, atau tidak menghubungkan apa pun pada port input kedua.
Jika Anda tidak ingin himpunan data kedua ditimbang sama dengan yang pertama, tentukan nilai untuk faktor Peluruhan. Nilai yang Anda ketik menunjukkan bagaimana kumpulan fitur dari transformasi kedua harus ditimbang.
Misalnya, nilai default 1 bobot kedua set fitur sama. Nilai 0,5 berarti bahwa fitur di set kedua akan memiliki setengah berat mereka di set pertama.
Secara opsional, tambahkan contoh modul Terapkan Transformasi , dan terapkan transformasi ke himpunan data.
Contoh
Untuk contoh bagaimana modul ini digunakan, lihat Galeri AI Azure:
Pembelajaran dengan Hitungan: Klasifikasi Biner: Menunjukkan cara menggunakan modul pembelajaran dengan hitungan untuk menghasilkan fitur dari kolom nilai kategoris untuk model klasifikasi biner.
Pembelajaran dengan Hitungan: Klasifikasi multiclass dengan data taksi NYC: Menunjukkan cara menggunakan modul pembelajaran dengan hitungan untuk melakukan klasifikasi multiclass pada himpunan data taksi NYC yang tersedia untuk umum. Sampel menggunakan pelajar regresi logistik multiclass untuk memodelkan masalah ini.
Pembelajaran dengan Hitungan: Klasifikasi biner dengan data taksi NYC: Menunjukkan cara menggunakan modul pembelajaran dengan hitungan untuk melakukan klasifikasi biner pada himpunan data taksi NYC yang tersedia untuk umum. Sampel menggunakan pembelajar regresi logistik dua kelas untuk memodelkan masalah.
Input yang diharapkan
Nama | Jenis | Deskripsi |
---|---|---|
Transformasi penghitungan sebelumnya | Antarmuka ITransform | Transformasi penghitungan untuk mengedit |
Transformasi penghitungan baru | Antarmuka ITransform | Transformasi penghitungan untuk ditambahkan (opsional) |
Parameter modul
Nama | Jenis | Rentang | Opsional | Deskripsi | Default |
---|---|---|---|---|---|
Faktor pembusukan | Mengambang | Diperlukan | 1.0f | Faktor peluruhan yang akan dikalikan dengan transformasi penghitungan di port input yang tepat |
Output
Nama | Jenis | Deskripsi |
---|---|---|
Transformasi penghitungan gabungan | Antarmuka ITransform | Transformasi gabungan |
Pengecualian
Pengecualian | Deskripsi |
---|---|
Kesalahan 0003 | Pengecualian terjadi jika satu atau beberapa input null atau kosong. |
Kesalahan 0086 | Pengecualian terjadi ketika transformasi penghitungan tidak valid. |