Monitorování spravedlnosti a předsudků u klasifikačních modelů
Důležité
Tato funkce je ve verzi Public Preview.
Díky monitorování Databricks Lakehouse můžete monitorovat předpovědi klasifikačního modelu a zjistit, jestli model funguje podobně s daty přidruženými k různým skupinám. Můžete například zjistit, jestli klasifikátor splácení půjčky generuje stejnou falešně pozitivní sazbu pro žadatele z různých demografických údajů.
Práce s metrikami spravedlnosti a předsudků
Pokud chcete monitorovat nestrannost a předsudky, vytvoříte logický výraz řezu. Skupina definovaná výrazem řezu, který se vyhodnocuje, True
se považuje za chráněnou skupinu (to znamená skupinu, se kterou kontrolujete předpojatost). Pokud například vytvoříte slicing_exprs=["age < 25"]
, řez identifikovaný slice_key
podle = "věk < 25" a slice_value
= True
je považován za chráněnou skupinu a řez identifikovaný slice_key
podle = "věk < 25" a slice_value
= False
je považován za nechráněnou skupinu.
Monitorování automaticky vypočítá metriky, které porovnávají výkon klasifikačního modelu mezi skupinami. V tabulce metrik profilu se hlásí následující metriky:
predictive_parity
, který porovnává přesnost modelu mezi skupinami.predictive_equality
, který porovnává míru falešně pozitivních výsledků mezi skupinami.equal_opportunity
, který měří, jestli je popisek stejně dobře předpovězen pro obě skupiny.statistical_parity
, který měří rozdíl v predikovaných výsledcích mezi skupinami.
Tyto metriky se počítají pouze v případě, že typ analýzy je InferenceLog
a problem_type
je classification
.
Definice těchto metrik najdete v následujících odkazech:
- Článek na Wikipedii o spravedlnosti ve strojovém učení:
https://en.wikipedia.org/wiki/Fairness_(machine_learning)
- Vysvětlení definic spravedlnosti, Verma a Rubin, 2018
Výstupy metrik spravedlnosti a předsudků
Podrobnosti o těchto metrikách a jejich zobrazení v tabulkách metrik najdete v referenčních informacích k rozhraní API . Všechny metriky spravedlnosti a předsudků sdílejí stejný datový typ, jak je znázorněno níže, a zobrazují skóre spravedlnosti vypočítané napříč všemi predikovanými třídami způsobem "1-proti všem" jako páry klíč-hodnota.
Na tyto metriky můžete vytvořit upozornění. Vlastník modelu může například nastavit upozornění, když metrika spravedlnosti překročí určitou prahovou hodnotu, a pak tuto výstrahu přesměrovat na osobu nebo tým, který je v pohotovosti, aby ho prošetřel.