Sdílet prostřednictvím


Monitorování spravedlnosti a předsudků u klasifikačních modelů

Důležité

Tato funkce je ve verzi Public Preview.

Díky monitorování Databricks Lakehouse můžete monitorovat předpovědi klasifikačního modelu a zjistit, jestli model funguje podobně s daty přidruženými k různým skupinám. Můžete například zjistit, jestli klasifikátor splácení půjčky generuje stejnou falešně pozitivní sazbu pro žadatele z různých demografických údajů.

Práce s metrikami spravedlnosti a předsudků

Pokud chcete monitorovat nestrannost a předsudky, vytvoříte logický výraz řezu. Skupina definovaná výrazem řezu, který se vyhodnocuje, True se považuje za chráněnou skupinu (to znamená skupinu, se kterou kontrolujete předpojatost). Pokud například vytvoříte slicing_exprs=["age < 25"], řez identifikovaný slice_key podle = "věk < 25" a slice_value = True je považován za chráněnou skupinu a řez identifikovaný slice_key podle = "věk < 25" a slice_value = False je považován za nechráněnou skupinu.

Monitorování automaticky vypočítá metriky, které porovnávají výkon klasifikačního modelu mezi skupinami. V tabulce metrik profilu se hlásí následující metriky:

  • predictive_parity, který porovnává přesnost modelu mezi skupinami.
  • predictive_equality, který porovnává míru falešně pozitivních výsledků mezi skupinami.
  • equal_opportunity, který měří, jestli je popisek stejně dobře předpovězen pro obě skupiny.
  • statistical_parity, který měří rozdíl v predikovaných výsledcích mezi skupinami.

Tyto metriky se počítají pouze v případě, že typ analýzy je InferenceLog a problem_type je classification.

Definice těchto metrik najdete v následujících odkazech:

Výstupy metrik spravedlnosti a předsudků

Podrobnosti o těchto metrikách a jejich zobrazení v tabulkách metrik najdete v referenčních informacích k rozhraní API . Všechny metriky spravedlnosti a předsudků sdílejí stejný datový typ, jak je znázorněno níže, a zobrazují skóre spravedlnosti vypočítané napříč všemi predikovanými třídami způsobem "1-proti všem" jako páry klíč-hodnota.

Na tyto metriky můžete vytvořit upozornění. Vlastník modelu může například nastavit upozornění, když metrika spravedlnosti překročí určitou prahovou hodnotu, a pak tuto výstrahu přesměrovat na osobu nebo tým, který je v pohotovosti, aby ho prošetřel.