Bagikan melalui


Tabel Hitung Impor

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.

Mengimpor tabel hitungan yang dibuat sebelumnya

Kategori: Pembelajaran dengan Hitungan

Catatan

Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja

Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.

Ringkasan Modul

Artikel ini menjelaskan cara menggunakan modul Impor Tabel Hitungan di Pembelajaran Mesin Studio (klasik).

Tujuan dari modul Tabel Hitung Impor adalah untuk memungkinkan pelanggan yang membuat tabel statistik berbasis hitungan menggunakan versi Pembelajaran Mesin sebelumnya untuk meningkatkan eksperimen mereka. Modul ini menggabungkan tabel hitungan yang ada dengan data baru.

Untuk informasi umum tentang tabel hitungan dan cara menggunakannya untuk membuat fitur, lihat Pembelajaran dengan Jumlah.

Penting

Modul ini disediakan semata-mata untuk kompatibilitas mundur dengan eksperimen yang menggunakan Build Count Table yang tidak digunakan lagi dan modul Count Featurizer yang tidak digunakan lagi. Kami menyarankan Anda meningkatkan eksperimen Anda untuk menggunakan modul yang lebih baru, untuk memanfaatkan fitur baru.

Untuk semua eksperimen baru, kami sarankan Anda menggunakan modul berikut:

Cara mengonfigurasi Tabel Jumlah Impor

  1. Di Pembelajaran Mesin Studio (klasik), buka eksperimen yang berisi tabel hitungan yang dibuat menggunakan modul Build Count Table yang tidak digunakan lagi.

  2. Tambahkan modul Impor Tabel Hitungan ke eksperimen.

  3. Koneksi dua output modul Build Count Table (usang) ke port input yang cocok dari Tabel Hitung Impor.

    Jika Anda memiliki kumpulan data lain dari jumlah yang ingin Anda gabungkan dengan tabel hitungan yang diimpor, sambungkan ke input paling kanan untuk modul Tabel Hitung Impor .

  4. Gunakan opsi Tipe penghitungan untuk menentukan di mana dan bagaimana tabel hitungan disimpan:

    • Himpunan data: Data yang digunakan untuk membuat jumlah disimpan sebagai himpunan data di Pembelajaran Mesin Studio (klasik).

    • Blob: Data yang digunakan untuk membuat jumlah disimpan sebagai blob blok di penyimpanan Windows Azure.

    • MapReduce: Data yang digunakan untuk membuat jumlah disimpan sebagai blob di penyimpanan Windows Azure.

      Opsi ini biasanya lebih disukai untuk himpunan data yang sangat besar. Untuk mengakses hitungan, Anda harus mengaktifkan kluster HDInsight. Pekerjaan MapReduce diluncurkan untuk melakukan penghitungan. Kedua aktivitas ini dapat dikenakan biaya penyimpanan dan komputasi.

      Untuk informasi selengkapnya, lihat HDInsight di Azure.

    Setelah menentukan mode penyimpanan data, Anda mungkin perlu memberikan informasi koneksi tambahan untuk data, bahkan jika sebelumnya Anda menggunakan modul Impor Data dalam percobaan untuk mengakses data. Itu karena modul Count Featurizer (usang) mengakses penyimpanan data secara terpisah untuk membaca data dan membangun tabel yang diperlukan.

  5. Gunakan opsi Hitung tipe tabel untuk menentukan format dan mode penyimpanan tabel yang digunakan untuk menyimpan jumlah.

    • Kamus: Menggunakan tabel jumlah kamus.

      Semua nilai kolom dalam kolom yang dipilih diperlakukan sebagai string, dan di-hash menggunakan array bit berukuran hingga 31 bit. Oleh karena itu, semua nilai kolom diwakili oleh bilangan bulat 32-bit non-negatif.

    • CMSketch: Menggunakan tabel yang disimpan dalam tabel sketsa minimum hitungan.

      Dengan format ini, beberapa fungsi hash independen dengan jangkauan yang lebih kecil digunakan untuk meningkatkan efisiensi memori dan mengurangi kemungkinan tabrakan hash.

    Secara umum, Anda harus menggunakan opsi Kamus untuk kumpulan data yang lebih kecil (<1GB), dan menggunakan opsi CMSketch untuk himpunan data yang lebih besar.

  6. Jalankan eksperimen.

  7. Setelah selesai, klik kanan output modul Tabel Hitung Impor , pilih Simpan sebagai Transformasi, dan ketik nama untuk transformasi. Saat Anda melakukan ini, tabel hitungan gabungan dan parameter featurization apa pun yang mungkin telah Anda terapkan disimpan dalam format yang dapat diterapkan ke himpunan data baru.

Contoh

Jelajahi contoh featurization berbasis hitungan menggunakan eksperimen sampel ini di Azure AI Gallery:

Catatan

Eksperimen Galeri ini semuanya dibuat menggunakan versi Pembelajaran yang lebih lama, dan sekarang tidak digunakan lagi, Pembelajaran dengan modul Count. Saat Anda membuka eksperimen di Studio (klasik), eksperimen akan ditingkatkan secara otomatis untuk menggunakan modul yang lebih baru.

Input yang diharapkan

Nama Jenis Deskripsi
Hitung metadata Tabel Data Metadata dari hitungan
Hitung tabel Tabel Data Tabel hitungan
Kumpulan data yang dihitung Tabel Data Kumpulan data yang digunakan untuk menghitung

Parameter modul

Nama Jenis Rentang Opsional Default Deskripsi
Tipe penghitungan CountingType Diperlukan Jenis penghitungan

Output

Nama Jenis Deskripsi
Transformasi penghitungan Antarmuka ITransform Transformasi penghitungan

Pengecualian

Pengecualian Deskripsi
Kesalahan 0003 Pengecualian terjadi jika satu atau beberapa input null atau kosong.
Kesalahan 0018 Pengecualian terjadi jika input himpunan data tidak valid.

Untuk daftar kesalahan khusus untuk modul Studio (klasik), lihat Pembelajaran Mesin Kode kesalahan.

Untuk daftar pengecualian API, lihat Pembelajaran Mesin Kode Kesalahan REST API.

Lihat juga

Pembelajaran dengan Hitungan