Aracılığıyla paylaş


Karşıtlık analizi ve durum

What-if karşıtlıkları, eylem girişini değiştirdiğinizde modelin ne tahmin edeceğinin sorusunu ele alır. Bir makine öğrenmesi modelinin giriş (özellik) değişikliklerine nasıl tepki verileceği konusunda anlaşılmasını ve hata ayıklamasını sağlar.

Standart yorumlanabilirlik teknikleri yaklaşık olarak bir makine öğrenmesi modeli veya özellikleri tahmine dayalı önem derecesine göre derecelendirilir. Buna karşılık, karşıt analiz, belirli bir veri noktasında hangi değişikliklerin model kararını döndüreceğini belirlemek için modeli "sorgular".

Böyle bir analiz, bağıntılı özelliklerin etkisini yalıtılmış olarak dağıtmaya yardımcı olur. Ayrıca sınıflandırma modellerinde model karar çevirme ve regresyon modellerine yönelik karar değişikliğini görmek için bir özellik değişikliğinin ne kadarının gerekli olduğunu daha ayrıntılı anlamanıza yardımcı olur.

Sorumlu yapay zeka panosunun karşıt analiz ve durum bileşeni iki işleve sahiptir:

  • Belirli bir noktada en az değişiklikle modelin tahminini değiştirecek şekilde (karşı model tahminleriyle en yakın veri noktalarını gösteren) bir dizi örnek oluşturun.
  • Modelin özellik değişikliklerine nasıl tepki gösterdiğini anlamak için kullanıcıların kendi durum pertürbasyonlarını oluşturmasına olanak tanıyın.

Sorumlu yapay zeka panosunun karşıt analiz bileşeninin en önemli farklarından biri, geçerli ve mantıksal karşıt örnekler için hangi özelliklerin değiştirildiğini ve izin verilen aralıklarını belirleyebilmenizdir.

Bu bileşenin özellikleri DiCE paketinden gelir.

Yapmanız gereken durumlarda karşıtlıkları kullanın:

  • Cinsiyet ve etnik köken gibi hassas öznitelikleri pertürbederek ve ardından model tahminlerinin değişip değişmediğini gözlemleyerek karar değerlendirici olarak eşitlik ve güvenilirlik ölçütlerini inceleyin.
  • Belirli giriş örneklerinde ayrıntılı hata ayıklama.
  • Kullanıcılara çözümler sağlayın ve modelden istenen sonucu elde etmek için neler yapabileceklerini belirleyin.

Karşıt örnekler nasıl oluşturulur?

Karşıtlık oluşturmak için DiCE birkaç modelden bağımsız teknik uygular. Bu yöntemler herhangi bir opaque-box sınıflandırıcısı veya regresörü için geçerlidir. Yakınlık (ve isteğe bağlı olarak, sparsity, diversity ve fizibilite) temelinde kayıp işlevini iyileştirirken, yakındaki noktaları bir giriş noktasına örneklemeyi temel alır. Şu anda desteklenen yöntemler şunlardır:

  • Rastgele arama: Bu yöntem bir sorgu noktasının yakınındaki noktaları rastgele örnekler ve tahmin edilen etiketi istenen sınıf olan noktalar olarak counterfactuals döndürür.
  • Genetik arama: Bu yöntem, sorgu noktasına yakınlığı iyileştirme, mümkün olduğunca az özellik değiştirme ve oluşturulan karşıtlıklar arasında çeşitlilik arama hedefini göz önünde bulundurarak bir genetik algoritma kullanarak noktaları örneklemektedir.
  • KD ağaç araması: Bu algoritma, eğitim veri kümesinden gelen karşıtlıkları döndürür. Uzaklık işlevini temel alarak eğitim veri noktalarının üzerinde bir KD ağacı oluşturur ve ardından istenen tahmin edilen etiketi veren belirli bir sorgu noktasına en yakın noktaları döndürür.

Sonraki adımlar