Bagikan melalui


Analisis kontrafaktual dan bagaimana-jika

Kontrafaktual bagaimana-jika mengatasi pertanyaan tentang apa yang akan diprediksi model jika Anda mengubah input tindakan. Mereka memungkinkan pemahaman dan penelusuran kesalahan model pembelajaran mesin dalam hal bagaimana ia bereaksi terhadap perubahan input (fitur).

Teknik interpretasi standar memperkirakan model pembelajaran mesin atau fitur peringkat berdasarkan kepentingan prediktifnya. Sebaliknya, analisis counterfaktual "menginterogasi" model untuk menentukan perubahan apa pada titik data tertentu yang akan membalikkan keputusan model.

Analisis semacam itu membantu dalam mengurai dampak fitur yang berkorelasi dalam isolasi. Ini juga membantu Anda mendapatkan pemahaman yang lebih bernuansa tentang berapa banyak perubahan fitur yang diperlukan untuk melihat flip keputusan model untuk model klasifikasi dan perubahan keputusan untuk model regresi.

Analisis counterfactual dan komponen bagaimana-jika dasbor AI yang Bertanggung Jawab memiliki dua fungsi:

  • Hasilkan sekumpulan contoh dengan perubahan minimal pada titik tertentu sehingga mengubah prediksi model (memperlihatkan titik data terdekat dengan prediksi model yang berlawanan).
  • Memungkinkan pengguna untuk menghasilkan perturbasi bagaimana-jika mereka sendiri untuk memahami bagaimana model bereaksi terhadap perubahan fitur.

Salah satu pembeda teratas komponen analisis counterfaktual dasbor AI yang bertanggung jawab adalah fakta bahwa Anda dapat mengidentifikasi fitur mana yang bervariasi dan rentang yang diizinkan untuk contoh counterfaktual yang valid dan logis.

Kemampuan komponen ini berasal dari paket DiCE .

Gunakan counterfactual bagaimana-jika saat Anda perlu:

  • Periksa kriteria kewajaran dan keandalan sebagai evaluator keputusan dengan mengganggu atribut sensitif seperti jenis kelamin dan etnis, lalu amati apakah prediksi model berubah.
  • Debug instans input tertentu secara mendalam.
  • Berikan solusi kepada pengguna dan tentukan apa yang dapat mereka lakukan untuk mendapatkan hasil yang diinginkan dari model.

Bagaimana contoh kontrafaktual dihasilkan?

Untuk menghasilkan kontrafaktual, DiCE mengimplementasikan beberapa teknik model-agnostik. Metode ini berlaku untuk pengklasifikasi atau regressor kotak buram. Mereka didasarkan pada pengambilan sampel titik terdekat ke titik input, sambil mengoptimalkan fungsi kerugian berdasarkan kedekatan (dan secara opsional, jarang, keragaman, dan kelayakan). Metode yang saat ini didukung adalah:

  • Pencarian acak: Metode ini mengambil sampel poin secara acak di dekat titik kueri dan mengembalikan counterfactual sebagai titik yang label prediksinya adalah kelas yang diinginkan.
  • Pencarian genetik: Metode ini mengambil sampel poin dengan menggunakan algoritma genetik, mengingat tujuan gabungan untuk mengoptimalkan kedekatan dengan titik kueri, mengubah fitur sesedikit mungkin, dan mencari keragaman di antara counterfactual yang dihasilkan.
  • Pencarian pohon KD: Algoritma ini mengembalikan counterfactual dari himpunan data pelatihan. Ini membangun pohon KD di atas titik data pelatihan berdasarkan fungsi jarak dan kemudian mengembalikan poin terdekat ke titik kueri tertentu yang menghasilkan label yang diprediksi yang diinginkan.

Langkah berikutnya