Transformasi Data - Skala dan Kurangi
Penting
Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.
Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.
- Lihat informasi tentang memindahkan proyek pembelajaran mesin dari ML Studio (klasik) ke Azure Machine Learning.
- Mer informasjon tentang Azure Machine Learning.
ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.
Artikel ini menjelaskan modul di Pembelajaran Mesin Studio (klasik) yang dapat membantu Anda bekerja dengan data numerik. Untuk pembelajaran mesin, tugas data umum termasuk kliping, binning, dan normalisasi nilai numerik. Modul lain mendukung pengurangan dimensi.
Catatan
Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja
Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.
Pemodelan data numerik
Tugas-tugas seperti normalisasi, binning, atau mendistribusikan kembali variabel numerik adalah bagian penting dari persiapan data untuk pembelajaran mesin. Modul dalam grup ini mendukung tugas persiapan data berikut:
- Mengelompokkan data ke dalam tempat sampah dengan berbagai ukuran atau distribusi.
- Menghapus outlier atau mengubah nilainya.
- Menormalkan satu set nilai numerik ke dalam rentang tertentu.
- Membuat kumpulan kolom fitur yang ringkas dari himpunan data berdimensi tinggi.
Tugas terkait
- Pilih fitur yang relevan dan berguna untuk digunakan dalam membangun model: Gunakan modul Pilihan Fitur atau Analisis Diskriminan Linier Fisher .
- Pilih fitur berdasarkan jumlah nilai: Gunakan modul Pembelajaran dengan Jumlah.
- Menghapus atau mengganti nilai yang hilang: Gunakan modul Bersihkan Data yang Hilang .
- Ganti nilai kategoris dengan nilai numerik yang berasal dari perhitungan: Gunakan modul Ganti Nilai Diskrit .
- Menghitung distribusi probabilitas untuk kolom diskrit atau numerik: Gunakan modul Fungsi Evaluasi Probabilitas .
- Memfilter dan mengubah sinyal digital dan bentuk gelombang: Gunakan modul Filter .
Daftar modul
Kategori Transformasi Data - Skala dan Kurangi ini mencakup modul berikut:
- Nilai Klip: Mendeteksi outlier, lalu klip atau mengganti nilainya.
- Mengelompokkan Data ke dalam Tempat Sampah: Menempatkan data numerik ke tempat sampah.
- Menormalkan Data: Mengubah skala data numerik untuk membatasi nilai himpunan data ke rentang standar.
- Analisis Komponen Utama: Menghitung serangkaian fitur yang telah mengurangi dimensi untuk pembelajaran yang lebih efisien.