Bagikan melalui


Gabungkan Transformasi Jumlah

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.

Membuat serangkaian fitur berdasarkan tabel hitungan

Kategori: Pembelajaran dengan Hitungan

Catatan

Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja

Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.

Ringkasan Modul

Artikel ini menjelaskan cara menggunakan modul Merge Count Transform di Pembelajaran Mesin Studio (klasik), untuk menggabungkan dua set fitur berbasis hitungan. Dengan menggabungkan dua set jumlah dan fitur terkait, Anda berpotensi meningkatkan cakupan dan distribusi fitur.

Pembelajaran dari hitungan sangat berguna dalam kumpulan data besar dengan fitur kardinalitas tinggi. Kemampuan untuk menggabungkan beberapa dataset ke dalam kumpulan fitur berbasis hitungan tanpa harus memproses ulang dataset membuatnya lebih mudah untuk mengumpulkan statistik pada dataset yang sangat besar dan menerapkannya ke dataset baru. Misalnya, tabel hitungan dapat digunakan untuk mengumpulkan informasi melalui terabyte data. Anda dapat menggunakan kembali statistik tersebut untuk meningkatkan akurasi model prediktif pada kumpulan data kecil.

Untuk menggabungkan dua set fitur berbasis hitungan, fitur harus dibuat menggunakan tabel yang memiliki skema yang sama: yaitu, kedua set harus menggunakan kolom yang sama, dan memiliki nama dan tipe data yang sama.

Cara mengonfigurasi Transformasi Jumlah Gabungan

  1. Untuk menggunakan Merge Count Transform, Anda harus telah membuat setidaknya satu transformasi berbasis hitungan, dan transformasi itu harus ada di ruang kerja Anda. Jika Anda menyimpan transformasi berbasis hitungan dari eksperimen yang berbeda, lihat di grup Transformasi . Jika Anda membuat transformasi dalam eksperimen saat ini, hubungkan output modul berikut:

    • Bangun Transformasi Penghitungan. Membuat transformasi berbasis hitungan baru dari data sumber.

    • Ubah Parameter Tabel Hitungan. Mengambil transformasi hitungan yang ada sebagai input dan menghasilkan transformasi yang diperbarui.

    • Tabel Hitung Impor. Modul ini mendukung kompatibilitas ke belakang dengan eksperimen lama yang menggunakan pembelajaran berbasis hitungan. Jika Anda menggunakan Tabel Hitung Impor untuk menganalisis distribusi nilai dalam himpunan data, lalu mengonversi nilai menjadi fitur menggunakan modul Count Featurizer yang tidak digunakan lagi, gunakan Tabel Hitung Impor untuk mengonversi hasilnya menjadi transformasi.

  2. Tambahkan modul Gabungkan Jumlah Transformasi ke eksperimen, dan hubungkan transformasi ke setiap input.

    Tip

    Transformasi kedua adalah input opsional - Anda dapat menghubungkan transformasi yang sama dua kali, atau tidak menghubungkan apa pun pada port input kedua.

  3. Jika Anda tidak ingin himpunan data kedua ditimbang sama dengan yang pertama, tentukan nilai untuk faktor Peluruhan. Nilai yang Anda ketik menunjukkan bagaimana kumpulan fitur dari transformasi kedua harus ditimbang.

    Misalnya, nilai default 1 bobot kedua set fitur sama. Nilai 0,5 berarti bahwa fitur di set kedua akan memiliki setengah berat mereka di set pertama.

  4. Secara opsional, tambahkan contoh modul Terapkan Transformasi , dan terapkan transformasi ke himpunan data.

Contoh

Untuk contoh bagaimana modul ini digunakan, lihat Galeri AI Azure:

Input yang diharapkan

Nama Jenis Deskripsi
Transformasi penghitungan sebelumnya Antarmuka ITransform Transformasi penghitungan untuk mengedit
Transformasi penghitungan baru Antarmuka ITransform Transformasi penghitungan untuk ditambahkan (opsional)

Parameter modul

Nama Jenis Rentang Opsional Deskripsi Default
Faktor pembusukan Mengambang Diperlukan 1.0f Faktor peluruhan yang akan dikalikan dengan transformasi penghitungan di port input yang tepat

Output

Nama Jenis Deskripsi
Transformasi penghitungan gabungan Antarmuka ITransform Transformasi gabungan

Pengecualian

Pengecualian Deskripsi
Kesalahan 0003 Pengecualian terjadi jika satu atau beberapa input null atau kosong.
Kesalahan 0086 Pengecualian terjadi ketika transformasi penghitungan tidak valid.

Lihat juga

Pembelajaran dengan Hitungan