Transformasi Data - Filter

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.

Artikel ini menjelaskan cara menggunakan modul filter di Pembelajaran Mesin Studio (klasik) untuk mengubah data digital. Modul dalam grup alat untuk Pembelajaran Mesin Studio (klasik) ini didasarkan pada filter yang dikembangkan untuk teknologi pemrosesan sinyal digital.

Catatan

Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja

Modul seret dan letakkan serupa tersedia di perancang Azure Machine Learning.

Filter biasanya diterapkan ke data dalam tahap pemrosesan data atau tahap praproses. Filter meningkatkan kejelasan sinyal yang digunakan untuk pembelajaran mesin. Misalnya, Anda dapat menggunakan modul filter di Pembelajaran Mesin Studio (klasik) untuk tugas pemrosesan ini:

  • Bersihkan bentuk gelombang yang digunakan untuk pengenalan ucapan.
  • Mendeteksi tren atau menghapus efek musiman dalam data penjualan atau ekonomi yang bising.
  • Menganalisis pola atau artefak dalam sinyal telemetri.

Modul ini menyediakan konfigurasi filter yang mudah dengan menggunakan algoritma yang diteliti dengan baik untuk mengubah data bentuk gelombang secara matematis. Anda juga dapat membuat filter kustom jika Anda telah menentukan koefisien yang benar untuk diterapkan ke data Anda.

Jika Anda perlu melakukan tugas seperti mengecualikan data dari himpunan data berdasarkan baris demi baris, menghapus nilai yang hilang, atau mengurangi ukuran himpunan data, gunakan modul ini sebagai gantinya:

  • Bersihkan Data yang Hilang: Hapus nilai yang hilang, atau ganti nilai yang hilang dengan tempat penampung.
  • Partisi dan Sampel: Bagi atau filter himpunan data Anda dengan menggunakan kriteria seperti rentang tanggal, nilai tertentu, atau ekspresi reguler.
  • Nilai Klip: Atur rentang nilai, dan pertahankan hanya nilai dalam rentang tersebut.

Filter dalam pemrosesan sinyal digital

Sama seperti Anda dapat melampirkan filter ke kamera untuk mengimbangi pencahayaan atau untuk membuat efek khusus, Anda dapat menerapkan filter ke data yang Anda gunakan untuk pembelajaran mesin. Filter dapat membantu meningkatkan kejelasan sinyal, menangkap karakteristik menarik, atau mengurangi kebisingan.

Filter yang ideal akan menghilangkan semua kebisingan dan memiliki sensitivitas yang seragam untuk sinyal yang diinginkan. Tapi, merancang bahkan filter yang cukup baik mungkin mengambil banyak perulangan atau kombinasi teknik. Jika Anda berhasil merancang filter yang efektif, pertimbangkan untuk menyimpan filter sehingga Anda dapat menggunakannya kembali saat mengubah data baru.

Secara umum, pemfilteran didasarkan pada prinsip analisis bentuk gelombang. Saat Anda merancang filter, Anda mencari cara untuk menekan atau memperkuat bagian sinyal, untuk mengekspos tren yang mendasar, untuk mengurangi kebisingan dan gangguan, atau untuk mengidentifikasi nilai data yang mungkin tidak dirasakan.

Berbagai teknik diterapkan untuk mengurai tren individu atau komponen bentuk gelombang yang membuat nilai data aktual. Rangkaian nilai dapat dianalisis dengan menggunakan fungsi trigonometri untuk mengidentifikasi dan mengisolasi bentuk gelombang individu. (Ini benar apakah itu seri ekonometrik atau frekuensi komposit sinyal audio.) Filter kemudian dapat diterapkan ke bentuk gelombang ini untuk menghilangkan kebisingan, memperkuat beberapa gelombang, atau menghapus komponen yang ditargetkan.

Saat pemfilteran diterapkan ke seri berisik untuk mengisolasi komponen yang berbeda, Anda dapat menentukan frekuensi mana yang akan dihapus atau diperkuat dengan menentukan pita frekuensi yang akan dikerjakan.

Filter digital di Pembelajaran Mesin Studio (klasik)

Jenis filter berikut didukung di Pembelajaran Mesin Studio (klasik):

  • Filter berdasarkan dekomposisi bentuk gelombang. Contohnya termasuk filter respons impuls terbatas (FIR) dan respons impuls tak terbatas (IIR). Filter ini berfungsi dengan menghapus komponen tertentu dari seri keseluruhan. Anda kemudian dapat melihat dan menyelidiki bentuk gelombang yang disederhanakan.
  • Filter berdasarkan rata-rata pemindahan atau nilai median. Filter ini memuluskan variasi dalam seri data dengan rata-rata di seluruh jendela waktu. Jendela dapat diperbaiki atau geser, dan dapat memiliki bentuk yang berbeda. Misalnya, jendela segitiga memuncak pada titik data saat ini (bobot nilai saat ini lebih kuat) dan ekor sebelum dan sesudah titik data (bobot mendahului dan mengikuti nilai kurang kuat).
  • Filter yang ditentukan pengguna atau kustom. Jika Anda sudah mengetahui transformasi yang harus diterapkan ke seri data, Anda dapat membuat filter yang ditentukan pengguna. Anda menyediakan koefisien numerik yang diterapkan untuk mengubah seri data. Filter kustom dapat meniru filter FIR atau IIR. Namun, dengan filter kustom, Anda memiliki lebih banyak kontrol atas nilai untuk diterapkan di setiap titik dalam seri.

Terminologi filter

Daftar berikut ini mencakup definisi istilah sederhana yang digunakan dalam parameter dan properti filter:

  • Passband: Rentang frekuensi yang dapat melewati filter tanpa dilemahkan atau dilemahkan.
  • Stopband: Rentang frekuensi antara batas yang ditentukan di mana sinyal tidak diteruskan. Anda menentukan stopband dengan mengatur frekuensi cut-off.
  • High pass: Biarkan hanya frekuensi tinggi melalui.
  • Low pass: Hanya terima frekuensi di bawah nilai cut-off tertentu.
  • Sudut: Menentukan batas antara frekuensi stopband dan passband. Biasanya, Anda memiliki opsi untuk memutuskan apakah sudut disertakan atau dikecualikan dari band. Filter urutan pertama menyebabkan pelambatan bertahap hingga frekuensi sudut. Setelah itu, filter menyebabkan redaman eksponensial. Filter urutan yang lebih tinggi (seperti filter Butterworth dan Chebyshev) memiliki lereng curam setelah frekuensi sudut. Filter urutan yang lebih tinggi meredakan nilai dalam stopband jauh lebih cepat dan penuh.
  • Filter bandstop (juga disebut filter penolakan pita atau filter notch ): Hanya memiliki satu stopband. Anda menentukan stopband dengan menentukan dua frekuensi: frekuensi cut-off tinggi dan frekuensi cut-off rendah. Filter bandpass biasanya memiliki dua stopband: satu di kedua sisi komponen yang diinginkan.
  • Riak: Variasi kecil yang tidak diinginkan yang terjadi secara berkala. Dalam Pembelajaran Mesin, Anda dapat menentukan jumlah riak yang akan ditoleransi sebagai bagian dari parameter dalam desain filter IIR.

Tip

Perlu informasi lebih lanjut? Jika Anda baru mengenal pemrosesan sinyal digital, lihat Pengantar Pemrosesan Sinyal Digital. Situs web ini menyediakan definisi dan bantuan visual bermanfaat yang menjelaskan terminologi dan konsep dasar.

Daftar modul

Modul berikut disertakan dalam kategori Transformasi Data - Filter :

Lihat juga