Bagikan melalui


Konversi ke Nilai Indikator

Penting

Dukungan untuk Studio Azure Machine Learning (klasik) akan berakhir pada 31 Agustus 2024. Sebaiknya Anda transisi ke Azure Machine Learning sebelum tanggal tersebut.

Mulai 1 Desember 2021, Anda tidak akan dapat membuat sumber daya Studio Azure Machine Learning (klasik) baru. Hingga 31 Agustus 2024, Anda dapat terus menggunakan sumber daya Pembelajaran Mesin Studio (klasik) yang ada.

ML Dokumentasi Studio (klasik) sedang berhenti dan mungkin tidak diperbarui di masa mendatang.

Mengonversi nilai kategoris dalam kolom menjadi nilai indikator

Kategori: Transformasi / Manipulasi Data

Catatan

Berlaku untuk: Pembelajaran Mesin Studio (klasik) saja

Modul drag-and-drop serupa tersedia di Azure Machine Learning desainer.

Ringkasan Modul

Artikel ini menjelaskan cara menggunakan modul Konversi ke Nilai Indikator di Pembelajaran Mesin Studio (klasik). Tujuan dari modul ini adalah untuk mengubah kolom yang berisi nilai kategoris menjadi serangkaian kolom indikator biner yang dapat lebih mudah digunakan sebagai fitur dalam model pembelajaran mesin.

Cara mengonfigurasi Konversi ke Nilai Indikator

  1. Tambahkan modul Konversi ke Nilai Indikator ke eksperimen Pembelajaran Mesin Anda, dan hubungkan ke himpunan data yang berisi kolom yang ingin Anda konversi. Anda dapat menemukan modul ini di bawah Transformasi Data, dalam kategori Manipulasi .

  2. Gunakan Pemilih Kolom untuk memilih satu atau beberapa kolom kategoris.

    Untuk memastikan bahwa kolom yang Anda pilih bersifat kategoris, gunakan Edit Metadata sebelum Konversi ke Nilai Indikator dalam eksperimen Anda, untuk menandai kolom target sebagai kategoris.

  3. Pilih opsi Timpa kolom kategoris jika Anda hanya ingin menghasilkan kolom Boolean baru.

    Secara default, opsi ini mati, yang memungkinkan Anda melihat kolom kategoris yang merupakan sumbernya, bersama dengan kolom indikator terkait.

    Tip

    Jika Anda memilih opsi untuk menimpa, kolom sumber sebenarnya tidak dihapus atau dimodifikasi. Sebaliknya, kolom baru dihasilkan dan disajikan dalam himpunan data output dan kolom sumber akan tetap tersedia di ruang kerja. Jika Anda perlu melihat data asli, Anda dapat menggunakan modul Tambahkan Kolom kapan saja untuk menambahkan kembali kolom sumber.

  4. Jalankan eksperimen.

Hasil

Misalnya, Anda memiliki kolom dengan skor yang menunjukkan apakah server memiliki probabilitas kegagalan yang tinggi, sedang atau rendah.

ID Server Skor kegagalan
10301 Rendah
10302 Medium
10303 Tinggi

Saat Anda menerapkan Konversi ke Nilai Indikator, satu kolom label diubah menjadi beberapa kolom yang berisi nilai Boolean:

ID Server Skor kegagalan - Rendah Skor kegagalan - Sedang Skor kegagalan - Tinggi
10301 1 0 0
10302 0 1 0
10303 0 0 1

Berikut cara kerja konversi:

  • Di kolom Skor kegagalan yang menjelaskan risiko, hanya ada tiga nilai yang mungkin (Tinggi, Sedang, dan Rendah) dan tidak ada nilai yang hilang. Oleh karena itu tepatnya tiga kolom baru dibuat.

  • Kolom indikator baru diberi nama berdasarkan judul kolom dan nilai kolom sumber, menggunakan pola ini: <nilai> data kolom>< sumber.

  • Harus ada 1 di tepat satu kolom indikator, dan 0 di semua kolom indikator lainnya. Itu karena setiap server hanya dapat memiliki satu peringkat risiko.

Anda sekarang dapat menggunakan tiga kolom indikator sebagai fitur dan menganalisis korelasinya dengan properti lain yang terkait dengan tingkat risiko yang berbeda.

Contoh

Untuk melihat contoh bagaimana modul ini digunakan, lihat Galeri AI Azure:

  • Deteksi kanker payudara: Pasien dibuang ke dalam kelompok berdasarkan nomor ID pasien, dan kemudian Nilai Indikator digunakan untuk menandai kelompok mana yang dimiliki pasien. Kemudian, indikator grup digunakan saat menilai model.

  • Pemasaran langsung: Probabilitas dibandingkan dengan konstanta dengan menggunakan Terapkan Operasi Matematika, dan nilai Ya / Tidak yang menunjukkan apakah skor di atas atau di bawah konstanta diubah menjadi kolom indikator baru.

  • Deteksi intrusi jaringan: Data log dimuat dari penyimpanan Azure. Variabel kelas (yang menjelaskan, misalnya, jika serangan adalah rootkit atau buffer overflow) diubah menjadi kolom kategoris dan kemudian diperluas ke beberapa nilai indikator.

Catatan teknis

Bagian ini berisi detail implementasi, tips, dan jawaban terkait pertanyaan yang sering diajukan.

Tips penggunaan

  • Hanya kolom yang ditandai sebagai kategoris yang dapat dikonversi menjadi kolom indikator. Jika Anda melihat kesalahan ini, kemungkinan salah satu kolom yang Anda pilih tidak kategoris:

    Kesalahan 0056: Kolom dengan nama> kolom nama <tidak dalam kategori yang diizinkan.

    Secara default sebagian besar kolom string ditangani sebagai fitur string, jadi Anda harus secara eksplisit menandainya sebagai kategoris menggunakan Edit Metadata.

  • Kesalahan ditampilkan jika Anda tidak memilih setidaknya satu kolom kategoris.

  • Tidak ada batasan jumlah kolom yang bisa Anda konversi ke kolom indikator. Namun, karena setiap kolom nilai dapat menghasilkan beberapa kolom indikator, Anda mungkin ingin mengonversi dan meninjau hanya beberapa kolom sekaligus.

  • Jika kolom berisi nilai yang hilang, kolom indikator terpisah dibuat untuk kategori yang hilang, dengan nama ini: <kolom> sumber- Hilang

  • Jika kolom yang Anda konversi ke nilai indikator berisi angka, kolom tersebut harus ditandai sebagai kategoris seperti kolom fitur lainnya. Setelah Anda melakukannya, angka diperlakukan sebagai nilai diskrit. Misalnya, jika Anda memiliki kolom numerik dengan nilai MPG mulai dari 25 hingga 30, kolom indikator baru akan dibuat untuk setiap nilai diskrit:

    Pastikan Jalan raya mpg -25 Jalan raya mpg -26 Jalan raya mpg -27 Jalan raya mpg -28 Jalan raya mpg -29 Jalan raya mpg -30
    Alfa Romeo 0 0 0 0 0 1

    Untuk menghindari mendapatkan sejumlah besar kolom indikator, kami sarankan Anda terlebih dahulu memeriksa jumlah nilai di kolom, dan membuang atau menghitung data dengan tepat.

Input yang diharapkan

Nama Jenis Deskripsi
Himpunan Data Tabel Data Himpunan data dengan kolom kategoris

Parameter modul

Nama Rentang Jenis Default Deskripsi
Kolom kategoris untuk dikonversi Semua Pilihan Kolom Pilih kolom kategoris untuk dikonversi ke matriks indikator.
Menimpa kolom kategoris Apa pun Boolean salah Jika Benar, menimpa kolom kategoris yang dipilih; jika tidak, tambahkan matriks indikator yang dihasilkan ke himpunan data.

Output

Nama Jenis Deskripsi
Kumpulan data hasil Tabel Data Himpunan data dengan kolom kategoris dikonversi menjadi matriks indikator.

Lihat juga

Manipulasi
Transformasi Data
Daftar Modul A-Z