Analisis kontrafaktual dan bagaimana-jika

Penghitung bagaimana-jika mengatasi pertanyaan tentang apa yang akan diprediksi model jika Anda mengubah input tindakan. Mereka memungkinkan pemahaman dan penelusuran kesalahan model pembelajaran mesin dalam hal bagaimana ia bereaksi terhadap perubahan input (fitur).

Teknik interpretabilitas standar memperkirakan model pembelajaran mesin atau fitur peringkat berdasarkan kepentingan prediktifnya. Sebaliknya, analisis counterfactual "menginterogasi" model untuk menentukan perubahan apa pada titik data tertentu yang akan membalik keputusan model.

Analisis semacam itu membantu dalam memutuskan dampak fitur yang berkorelasi dalam isolasi. Ini juga membantu Anda mendapatkan pemahaman yang lebih bernuansa tentang berapa banyak perubahan fitur yang diperlukan untuk melihat flip keputusan model untuk model klasifikasi dan perubahan keputusan untuk model regresi.

Analisis kontrafaktual dan komponen bagaimana-jikadasbor AI Yang Bertanggung Jawab memiliki dua fungsi:

  • Hasilkan sekumpulan contoh dengan perubahan minimal pada titik tertentu sehingga mengubah prediksi model (memperlihatkan titik data terdekat dengan prediksi model yang berlawanan).
  • Memungkinkan pengguna untuk menghasilkan perturbasi bagaimana-jika mereka sendiri untuk memahami bagaimana model bereaksi terhadap perubahan fitur.

Salah satu pembeda teratas komponen analisis counterfaktual dasbor AI yang bertanggung jawab adalah fakta bahwa Anda dapat mengidentifikasi fitur mana yang akan bervariasi dan rentang yang diizinkan untuk contoh counterfactual yang valid dan logis.

Kemampuan komponen ini berasal dari paket DiCE .

Gunakan counterfactual bagaimana-jika saat Anda perlu:

  • Periksa kriteria kewajaran dan keandalan sebagai evaluator keputusan dengan mengganggu atribut sensitif seperti jenis kelamin dan etnis, lalu amati apakah prediksi model berubah.
  • Debug instans input tertentu secara mendalam.
  • Berikan solusi kepada pengguna dan tentukan apa yang dapat mereka lakukan untuk mendapatkan hasil yang diinginkan dari model.

Bagaimana contoh kontrafaktual dihasilkan?

Untuk menghasilkan kontrafaktual, DiCE mengimplementasikan beberapa teknik model-agnostik. Metode ini berlaku untuk pengklasifikasi atau regressor kotak buram. Mereka didasarkan pada pengambilan sampel titik terdekat ke titik input, sambil mengoptimalkan fungsi kerugian berdasarkan kedekatan (dan secara opsional, jarang, keragaman, dan kelayakan). Metode yang saat ini didukung adalah:

  • Pencarian acak: Metode ini mengambil sampel poin secara acak di dekat titik kueri dan mengembalikan counterfactual sebagai titik yang label yang diprediksi adalah kelas yang diinginkan.
  • Pencarian genetik: Metode ini mengambil sampel titik dengan menggunakan algoritma genetik, mengingat tujuan gabungan untuk mengoptimalkan kedekatan dengan titik kueri, mengubah fitur sesedikit mungkin, dan mencari keragaman di antara counterfactual yang dihasilkan.
  • Pencarian pohon KD: Algoritma ini mengembalikan kontrafaktual dari himpunan data pelatihan. Ini membangun pohon KD di atas titik data pelatihan berdasarkan fungsi jarak dan kemudian mengembalikan titik terdekat ke titik kueri tertentu yang menghasilkan label yang diprediksi yang diinginkan.

Langkah berikutnya