Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Penting
Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.
Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.
- Lihat informasi tentang memindahkan proyek pembelajaran mesin dari ML Studio (klasik) ke Azure Machine Learning.
- Mer informasjon tentang Azure Machine Learning.
ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.
Menerapkan filter ke kolom tertentu dari himpunan data
Kategori: Transformasi / Filter Data
Catatan
Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja
Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.
Ringkasan Modul
Artikel ini menjelaskan cara menggunakan modul Terapkan Filter di Pembelajaran Mesin Studio (klasik), untuk mengubah kolom nilai dengan menerapkan filter yang telah ditentukan sebelumnya. Filter digunakan dalam pemrosesan sinyal digital untuk mengurangi kebisingan atau menyorot pola. Dengan demikian, nilai-nilai yang Anda ubah selalu numerik, dan biasanya mewakili semacam sinyal audio atau visual.
Tip
Apakah Anda mencari jenis filter yang berbeda? Studio (klasik) menyediakan modul-modul ini untuk pengambilan sampel data, mendapatkan subset data, menghapus nilai buruk, atau membuat set pengujian dan pelatihan: Pisahkan Data, Bersihkan Data yang Hilang, Partisi dan Sampel, Terapkan Transformasi SQL, Nilai Klip. Jika Anda perlu memfilter data saat membacanya dari sumber, lihat Mengimpor Data. Opsinya tergantung pada jenis sumber.
Setelah menentukan jenis filter mana yang terbaik untuk sumber data Anda, Anda menentukan parameter, dan menggunakan Terapkan Filter untuk mengubah himpunan data. Karena desain filter terpisah dari proses penerapan filter, filter dapat digunakan kembali. Misalnya, jika Anda sering bekerja dengan data yang digunakan untuk peramalan, Anda dapat merancang beberapa jenis filter rata-rata bergerak untuk melatih dan membandingkan beberapa model. Anda juga dapat menyimpan filter untuk diterapkan ke eksperimen lain atau ke himpunan data yang berbeda.
Cara mengonfigurasi Terapkan Filter
Tambahkan modul Terapkan Filter ke eksperimen Anda. Anda dapat menemukan modul filter IIR di bawah Transformasi Data, dalam kategori Filter .
Ke input sebelah kanan, hubungkan himpunan data yang berisi nilai numerik ke satu input.
Ke input sebelah kiri, sambungkan filter yang ada. Anda dapat menggunakan kembali filter yang disimpan, atau Anda dapat mengonfigurasi filter dengan menggunakan salah satu modul filter berikut: Filter Ambang Batas, Filter Rata-Rata Bergerak, Filter Median, Filter IIR, Filter FIR, Filter yang Ditentukan Pengguna.
Di panel PropertiTerapkan Filter, klik Luncurkan pemilih kolom dan pilih kolom tempat filter harus diterapkan.
Jalankan eksperimen, atau klik kanan Terapkan Filter dan klik Jalankan dipilih.
Hasil
Output hanya berisi data dalam kolom yang dipilih, diubah dengan menerapkan transformasi matematika yang telah ditentukan sebelumnya.
Jika Anda ingin melihat kolom lain dalam himpunan data, Anda dapat menggunakan modul Tambahkan Kolom untuk menggabungkan himpunan data asli dan difilter.
Catatan
Nilai di kolom asli belum dihapus atau ditimpa, dan masih tersedia dalam percobaan untuk referensi. Namun, output filter biasanya lebih berguna untuk pemodelan.
Contoh
Untuk contoh bagaimana filter digunakan dalam pembelajaran mesin, lihat Galeri AI Azure:
- Filter: Mendemonstrasikan semua jenis filter, menggunakan himpunan data bentuk gelombang yang direkayasa.
Catatan teknis
Bagian ini berisi detail implementasi, tips, dan jawaban atas pertanyaan yang sering diajukan.
Modul Terapkan Filter mengikat jenis filter yang ditentukan ke kolom yang dipilih. Jika Anda perlu menerapkan berbagai jenis filter ke kolom yang berbeda, Anda harus menggunakan Pilih Kolom dalam Himpunan Data untuk mengisolasi kolom dan menerapkan jenis filter yang berbeda dalam alur kerja terpisah. Untuk informasi selengkapnya, lihat Memilih Kolom dalam Himpunan Data.
Filter tidak melewati kolom data yang tidak terpengaruh oleh filter. Artinya, output Apply Filter hanya berisi nilai numerik yang diubah. Namun, Anda dapat menggunakan modul Tambahkan Kolom untuk menggabungkan nilai yang diubah dengan himpunan data sumber.
Periode filter
Periode filter ditentukan sebagian oleh jenis filter, sebagai berikut:
Untuk respons impuls terbatas (FIR), rata-rata bergerak sederhana, dan filter rata-rata bergerak segitiga, periode filter terbatas.
Untuk respons impuls tak terbatas (IIR), rata-rata bergerak eksponensial, dan filter rata-rata bergerak kumulatif, periode filter tidak terbatas.
Untuk filter ambang batas, periode filter selalu 1.
Untuk filter median, terlepas dari periode filter, NaNs dan nilai yang hilang dalam sinyal input tidak menghasilkan NaNs baru dalam output.
Nilai yang hilang
Bagian ini menjelaskan perilaku saat nilai yang hilang ditemui, menurut jenis filter. Secara umum, ketika filter menemukan NaN atau nilai yang hilang dalam himpunan data input, himpunan data output menjadi dimanjakan dengan NaNs untuk beberapa jumlah sampel berikutnya, tergantung pada periode filter. Ini memiliki konsekuensi sebagai berikut:
FIR, rata-rata bergerak sederhana, atau filter rata-rata bergerak segitiga memiliki periode terbatas. Akibatnya, setiap nilai yang hilang akan diikuti oleh sejumlah NaNs sama dengan urutan filter dikurangi satu.
IIR, exponential moving average, atau filter moving average kumulatif memiliki periode yang tak terbatas. Akibatnya, setelah nilai hilang pertama ditemukan, NaNs akan terus menyebar tanpa batas waktu.
Dalam filter ambang batas, periode filter ambang batas adalah 1. Akibatnya, nilai yang hilang dan NaNs tidak menyebar.
Untuk filter median, NaNs dan nilai yang hilang yang ditemui dalam himpunan data input tidak menghasilkan NaNs baru dalam output, terlepas dari periode filter.
Input yang diharapkan
| Nama | Jenis | Deskripsi |
|---|---|---|
| Filter | Antarmuka IFilter | Implementasi filter |
| Himpunan Data | Tabel Data | Himpunan data input |
Untuk daftar kesalahan khusus untuk modul Studio (klasik), lihat Pembelajaran Mesin Kode kesalahan.
Untuk daftar pengecualian API, lihat Pembelajaran Mesin Kode Kesalahan REST API.
Parameter modul
| Nama | Rentang | Jenis | Default | Deskripsi |
|---|---|---|---|---|
| Kumpulan kolom | Semua | Pilihan Kolom | NumericAll | Pilih kolom yang akan difilter |
Output
| Nama | Jenis | Deskripsi |
|---|---|---|
| Kumpulan data hasil | Tabel Data | Himpunan data output |