Transformasi Data
Penting
Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.
Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.
- Lihat informasi tentang memindahkan proyek pembelajaran mesin dari ML Studio (klasik) ke Azure Machine Learning.
- Mer informasjon tentang Azure Machine Learning.
ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.
Artikel ini mencantumkan modul yang disediakan di Pembelajaran Mesin Studio (klasik) untuk transformasi data. Untuk pembelajaran mesin, transformasi data memerlukan beberapa tugas yang sangat umum, seperti bergabung dengan himpunan data atau mengubah nama kolom. Tapi, itu juga mencakup banyak tugas yang khusus untuk pembelajaran mesin, seperti normalisasi, binning dan pengelompokan, dan kesimpulan nilai yang hilang.
Catatan
Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja
Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.
Penting
Data yang Anda gunakan di Pembelajaran Mesin Studio (klasik) umumnya diharapkan "rapi" sebelum Anda mengimpornya ke Pembelajaran Mesin Studio (klasik). Persiapan data mungkin termasuk, misalnya, memastikan bahwa data menggunakan pengkodean yang benar dan memeriksa bahwa data memiliki skema yang konsisten.
Modul untuk transformasi data dikelompokkan ke dalam kategori berbasis tugas berikut:
- Membuat filter untuk pemrosesan sinyal digital: Filter sinyal digital dapat diterapkan ke data numerik untuk mendukung tugas pembelajaran mesin seperti pengenalan gambar, pengenalan suara, dan analisis bentuk gelombang.
- Menghasilkan dan menggunakan fitur berbasis hitungan: Modul featurization berbasis hitungan membantu Anda mengembangkan fitur ringkas untuk digunakan dalam pembelajaran mesin.
- Manipulasi dan persiapan data umum: Menggabungkan himpunan data, membersihkan nilai yang hilang, mengelompokkan dan meringkas data, mengubah nama kolom dan tipe data, atau menunjukkan kolom mana yang merupakan label atau fitur.
- Pengambilan sampel dan pemisahan himpunan data: Bagi data Anda menjadi kumpulan pelatihan dan pengujian, pisahkan himpunan data berdasarkan persentase atau dengan kondisi filter, atau lakukan pengambilan sampel.
- Penskalaan dan pengurangan data: Siapkan data numerik untuk analisis dengan menerapkan normalisasi atau dengan menskalakan. Bin data ke dalam grup, menghapus atau mengganti outlier, atau melakukan analisis komponen utama (PCA).
Daftar modul
Kategori modul berikut termasuk dalam kategori Transformasi Data :
- Transformasi Data - Filter
- Pembelajaran dengan Hitungan
- Transformasi Data - Manipulasi
- Transformasi Data - Sampel dan Split
- Transformasi Data - Skala dan Kurangi