Bagikan melalui


Transformasi Data

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.

Artikel ini mencantumkan modul yang disediakan di Pembelajaran Mesin Studio (klasik) untuk transformasi data. Untuk pembelajaran mesin, transformasi data memerlukan beberapa tugas yang sangat umum, seperti bergabung dengan himpunan data atau mengubah nama kolom. Tapi, itu juga mencakup banyak tugas yang khusus untuk pembelajaran mesin, seperti normalisasi, binning dan pengelompokan, dan kesimpulan nilai yang hilang.

Catatan

Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja

Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.

Penting

Data yang Anda gunakan di Pembelajaran Mesin Studio (klasik) umumnya diharapkan "rapi" sebelum Anda mengimpornya ke Pembelajaran Mesin Studio (klasik). Persiapan data mungkin termasuk, misalnya, memastikan bahwa data menggunakan pengkodean yang benar dan memeriksa bahwa data memiliki skema yang konsisten.

Modul untuk transformasi data dikelompokkan ke dalam kategori berbasis tugas berikut:

  • Membuat filter untuk pemrosesan sinyal digital: Filter sinyal digital dapat diterapkan ke data numerik untuk mendukung tugas pembelajaran mesin seperti pengenalan gambar, pengenalan suara, dan analisis bentuk gelombang.
  • Menghasilkan dan menggunakan fitur berbasis hitungan: Modul featurization berbasis hitungan membantu Anda mengembangkan fitur ringkas untuk digunakan dalam pembelajaran mesin.
  • Manipulasi dan persiapan data umum: Menggabungkan himpunan data, membersihkan nilai yang hilang, mengelompokkan dan meringkas data, mengubah nama kolom dan tipe data, atau menunjukkan kolom mana yang merupakan label atau fitur.
  • Pengambilan sampel dan pemisahan himpunan data: Bagi data Anda menjadi kumpulan pelatihan dan pengujian, pisahkan himpunan data berdasarkan persentase atau dengan kondisi filter, atau lakukan pengambilan sampel.
  • Penskalaan dan pengurangan data: Siapkan data numerik untuk analisis dengan menerapkan normalisasi atau dengan menskalakan. Bin data ke dalam grup, menghapus atau mengganti outlier, atau melakukan analisis komponen utama (PCA).

Daftar modul

Kategori modul berikut termasuk dalam kategori Transformasi Data :

Lihat juga