Sınıflandırma modelleri için eşitliği ve yanlılığı izleme
Önemli
Bu özellik Genel Önizleme aşamasındadır.
Databricks Lakehouse İzleme ile bir sınıflandırma modelinin tahminlerini izleyerek modelin farklı gruplarla ilişkili veriler üzerinde benzer şekilde performans gösterip göstermediğini görebilirsiniz. Örneğin, kredi varsayılan sınıflandırıcısının farklı demografik bilgilerden başvuranlar için aynı hatalı pozitif oranı oluşturup oluşturmadığını araştırabilirsiniz.
Eşitlik ve sapma ölçümleriyle çalışma
Eşitliği ve sapmayı izlemek için bir Boole dilim ifadesi oluşturursunuz. değerlendirilen True
dilim ifadesi tarafından tanımlanan grup korumalı grup olarak kabul edilir (yani, yanlılık denetimi yaptığınız grup). Örneğin, oluşturursanız slicing_exprs=["age < 25"]
, = "yaş < 25" ile slice_key
tanımlanan ve = slice_value
True
korumalı grup olarak kabul edilen dilim ve = "yaş < 25" ile slice_key
tanımlanan dilim ve slice_value
= False
korumasız grup olarak kabul edilir.
İzleyici, gruplar arasındaki sınıflandırma modelinin performansını karşılaştıran ölçümleri otomatik olarak hesaplar. Profil ölçümleri tablosunda aşağıdaki ölçümler bildirilir:
predictive_parity
, modelin gruplar arasındaki duyarlığı karşılaştırır.predictive_equality
, gruplar arasındaki hatalı pozitif oranları karşılaştırır.equal_opportunity
, bir etiketin her iki grup için de eşit derecede iyi tahmin edilip edilmediğini ölçer.statistical_parity
, gruplar arasındaki tahmin edilen sonuçlardaki farkı ölçer.
Bu ölçümler yalnızca analiz türü ve problem_type
olduğunda InferenceLog
classification
hesaplanır.
Bu ölçümlerin tanımları için aşağıdaki başvurulara bakın:
- Makine öğrenmesinde eşitlik hakkında Wikipedia makalesi:
https://en.wikipedia.org/wiki/Fairness_(machine_learning)
- Eşitlik Tanımları Açıklandı, Verma ve Rubin, 2018
Eşitlik ve sapma ölçümleri çıkışları
Bu ölçümlerle ilgili ayrıntılar ve bunları ölçüm tablolarında görüntüleme hakkında bilgi için API başvurusuna bakın. Tüm eşitlik ve sapma ölçümleri aşağıda gösterildiği gibi aynı veri türünü paylaşır ve tüm tahmin edilen sınıflar arasında anahtar-değer çiftleri olarak "bire bir" şekilde hesaplanan eşitlik puanlarını gösterir.
Bu ölçümler üzerinde bir uyarı oluşturabilirsiniz. Örneğin, modelin sahibi eşitlik ölçümü bir eşiği aştığında bir uyarı ayarlayabilir ve ardından bu uyarıyı araştırmak üzere bir aramadaki kişiye veya ekiliğe yönlendirebilir.