Interpretovatelnost modelů

2025-05-02

Tento článek popisuje metody, které můžete použít k interpretaci modelu ve službě Azure Machine Learning.

Proč je pro ladění modelů důležité interpretovatelnost modelu

Když používáte modely strojového učení způsobem, který ovlivňuje životy lidí, je důležité pochopit, co má vliv na chování modelů. Interpretovatelnost pomáhá zodpovědět otázky ve scénářích, jako jsou:

Ladění modelu: Proč můj model udělal tuto chybu? Jak můžu svůj model vylepšit?
Spolupráce na lidské umělé inteligenci: Jak můžu pochopit a důvěřovat rozhodnutí modelu?
Dodržování právních předpisů: Vyhovuje můj model právním požadavkům?

Komponenta interpretovatelnosti řídicího panelu Zodpovědné umělé inteligence přispívá k "diagnostice" fáze pracovního postupu životního cyklu modelu generováním popisů predikcí modelu strojového učení, které jsou srozumitelné pro člověka. Poskytuje více zobrazení chování modelu:

Globální vysvětlení: Jaké funkce mají například vliv na celkové chování modelu přidělování úvěrů?
Místní vysvětlení: Proč byla například žádost o půjčku zákazníka schválena nebo odmítnuta?

Můžete také sledovat vysvětlení modelu pro vybranou kohortu jako podskupinu datových bodů. Tento přístup je cenný, když například posuzujete nestrannost v předpovědích modelu pro jednotlivce v konkrétní demografické skupině. Karta Místní vysvětlení této komponenty také představuje úplnou vizualizaci dat, která je skvělá pro obecné ohlédnutí dat a pohled na rozdíly mezi správnými a nesprávnými předpověďmi každé kohorty.

Schopnosti této komponenty jsou založeny balíčkem InterpretML , který generuje vysvětlení modelu.

Interpretovatelnost použijte v případě, že potřebujete:

Zjistěte, jak důvěryhodné jsou předpovědi systému AI tím, že pochopíte, jaké funkce jsou pro predikce nejdůležitější.
Přistupte k ladění modelu tak, že ho nejprve pochopíte a zjistíte, jestli model používá funkce, které jsou v pořádku, nebo jen falešné korelace.
Odkryjte potenciální zdroje nespravedlivosti tím, že pochopíte, jestli model vychází z předpovědí na citlivých funkcích nebo na funkcích, které s nimi vysoce korelují.
Vytvořte důvěru uživatelů v rozhodování o modelu generováním místních vysvětlení, která ilustrují jejich výsledky.
Dokončete regulační audit systému AI, který ověřuje modely a monitoruje dopad rozhodnutí modelu na člověka.

Jak interpretovat model

Ve strojovém učení jsou funkce datovými poli, která používáte k predikci cílového datového bodu. Například k predikci úvěrového rizika můžete použít datová pole pro věk, velikost účtu a věk účtu. Tady jsou funkce věku, velikosti účtu a věku účtu. Důležitost funkce vám říká, jak každé datové pole ovlivňuje predikce modelu. I když například můžete v předpovědi výrazně používat věk, velikost účtu a věk účtu nemusí významně ovlivnit hodnoty predikce. Díky tomuto procesu můžou datoví vědci vysvětlit výsledné předpovědi způsoby, které zúčastněným stranám poskytnou přehled o nejdůležitějších funkcích modelu.

Pomocí tříd a metod na řídicím panelu Zodpovědné AI a pomocí sady SDK v2 a rozhraní příkazového řádku v2 můžete:

Vysvětlit predikci modelu generováním hodnot důležitosti funkcí pro celý model (globální vysvětlení) nebo jednotlivých datových bodů (místní vysvětlení).
Dosažení interpretovatelnosti modelů u skutečných datových sad ve velkém měřítku
Pomocí interaktivního řídicího panelu vizualizace můžete zjistit vzory v datech a jeho vysvětlení v době trénování.

Podporované techniky interpretace modelu

Řídicí panel zodpovědné umělé inteligence používá techniky interpretovatelnosti, které byly vyvinuty v interpretační komunitě, opensourcový balíček Pythonu pro trénování interpretovatelných modelů a pomáhá vysvětlit neprůkladné systémy AI. Neprůzorné modely jsou ty, pro které nemáme žádné informace o jejich vnitřních činnostech.

Interpret-Community slouží jako hostitel pro následující podporované vysvětlení a v současné době podporuje techniky interpretovatelnosti uvedené v dalších částech.

Podporováno v řídicím panelu Zodpovědné AI v sadě Python SDK v2 a CLI v2

Technika interpretace	Popis	Typ
Mimic Explainer (Globální náhradník) + strom SHAP	Mimic Explainer je založen na myšlence trénování globálních náhradních modelů na napodobování neprůpažných modelů. Globální náhradní model je vnitřně interpretovatelný model, který je natrénovaný tak, aby co nejpřesněji odhadoval predikce libovolného neprůmyslného modelu. Datoví vědci můžou náhradní model interpretovat tak, aby vytáhli závěry o neprůhlhlým modelu. Řídicí panel zodpovědné umělé inteligence používá lightGBM (LGBMExplainableModel) spárovaný s vysvětlením stromu SHAP (SHapley Additive exPlanations), což je konkrétní vysvětlení stromů a souborů stromů. Kombinace stromu LightGBM a SHAP poskytuje globální a místní vysvětlení modelů strojového učení nezávislé na modelu.	Nezávislá na modelu

Podporované techniky interpretace modelu pro textové modely

Technika interpretace	Popis	Typ	Textový úkol
Text SHAP	SHAP (SHapley Additive exPlanations) je oblíbená metoda vysvětlení hlubokých neurálních sítí, která poskytuje přehled o příspěvku jednotlivých vstupních funkcí k dané predikci. Vychází z konceptu hodnot Shapley, což je metoda přiřazování kreditu jednotlivým hráčům v kooperativní hře. SHAP tento koncept aplikuje na vstupní funkce neurální sítě tím, že vypočítá průměrný příspěvek každé funkce k výstupu modelu ve všech možných kombinacích funkcí. V případě textu se SHAP rozdělí na slova hierarchickým způsobem a považuje každé slovo nebo token za funkci. Tím se vytvoří sada hodnot přisuzování, které kvantifikují důležitost každého slova nebo tokenu pro danou předpověď. Poslední mapa přisuzování je generována vizualizací těchto hodnot jako heat mapa nad původním textovým dokumentem. SHAP je modelově nezávislá metoda a dá se použít k vysvětlení široké škály modelů hlubokého učení, včetně sítí CNN, RNN a transformátorů. Kromě toho poskytuje několik žádoucích vlastností, jako je konzistence, přesnost a nestrannost, což představuje spolehlivou a interpretovatelnou techniku pro pochopení rozhodovacího procesu modelu.	Nezávislá na modelu	Klasifikace více tříd textu, klasifikace více popisků textu

Podporované techniky interpretace modelů pro modely obrázků

Technika interpretace	Popis	Typ	Úloha zpracování obrazu
Vision SHAP	SHAP (SHapley Additive exPlanations) je oblíbená metoda vysvětlení hlubokých neurálních sítí, která poskytuje přehled o příspěvku jednotlivých vstupních funkcí k dané predikci. Vychází z konceptu hodnot Shapley, což je metoda přiřazování kreditu jednotlivým hráčům v kooperativní hře. SHAP tento koncept aplikuje na vstupní funkce neurální sítě tím, že vypočítá průměrný příspěvek každé funkce k výstupu modelu ve všech možných kombinacích funkcí. Pro konkrétní vizi se SHAP rozdělí na obrázek hierarchickým způsobem a považuje superpixelové oblasti obrázku za každou funkci. Výsledkem je sada hodnot přisuzování, které kvantifikují důležitost každého superpixelu nebo oblasti obrázku pro danou předpověď. Konečná mapa přisuzování se generuje vizualizací těchto hodnot jako heat mapy. SHAP je modelově nezávislá metoda a dá se použít k vysvětlení široké škály modelů hlubokého učení, včetně sítí CNN, RNN a transformátorů. Kromě toho poskytuje několik žádoucích vlastností, jako je konzistence, přesnost a nestrannost, což představuje spolehlivou a interpretovatelnou techniku pro pochopení rozhodovacího procesu modelu.	Nezávislá na modelu	Klasifikace více tříd obrázků, klasifikace více popisků obrázků
Backprop s asistencí	Backprop s asistencí je oblíbená metoda vysvětlení hlubokých neurálních sítí, která poskytuje přehledy o naučených reprezentacích modelu. Vygeneruje vizualizaci vstupních funkcí, které aktivují konkrétní neuron v modelu tím, že výpočet přechodu výstupu s ohledem na vstupní obrázek. Na rozdíl od jiných metod založených na gradientech se backpropproppropguje pouze prostřednictvím kladných přechodů a používá upravenou aktivační funkci ReLU k zajištění toho, aby negativní přechody neovlivnily vizualizaci. Výsledkem je interpretovatelná mapa s vysokou mírou rozlišení, která zvýrazní nejdůležitější funkce vstupního obrázku pro danou předpověď. Backprop s asistencí lze použít k vysvětlení široké škály modelů hlubokého učení, včetně konvolučních neurálních sítí (CNN), rekurentních neurálních sítí (RNN) a transformátorů.	AutoML (automatizované strojové učení)	Klasifikace více tříd obrázků, klasifikace více popisků obrázků
GradCAM s asistencí	GradCAM je oblíbená metoda vysvětlení hlubokých neurálních sítí, která poskytuje přehledy o naučených reprezentacích modelu. Vygeneruje vizualizaci vstupních funkcí, které přispívají nejvíce do konkrétní výstupní třídy kombinací přístupu založeného na přechodu řízené zpětného šíření s lokalizačním přístupem GradCAM. Konkrétně vypočítá přechody výstupní třídy s ohledem na mapy funkcí poslední konvoluční vrstvy v síti a pak vyváže každou mapu funkcí podle důležitosti jeho aktivace pro danou třídu. Tím se vytvoří heat mapa s vysokým rozlišením, která zvýrazní nejvýraznější oblasti vstupního obrázku pro danou výstupní třídu. GradCAM s asistencí lze použít k vysvětlení široké škály modelů hlubokého učení, včetně sítí CNN, RNN a transformátorů. Kromě toho začleněním řízené zpětného šíření zajišťuje, aby vizualizace byla smysluplná a interpretovatelná, aby nedocházelo k nechutným aktivacím a negativním příspěvkům.	AutoML (automatizované strojové učení)	Klasifikace více tříd obrázků, klasifikace více popisků obrázků
Integrované přechody	Integrované přechody jsou oblíbenou metodou vysvětlení hlubokých neurálních sítí, která poskytuje přehled o příspěvku jednotlivých vstupních funkcí k dané predikci. Vypočítá integrál přechodu výstupní třídy s ohledem na vstupní obrázek podél rovné cesty mezi základním obrázkem a skutečným vstupním obrázkem. Tato cesta je obvykle zvolena jako lineární interpolace mezi dvěma obrázky, přičemž základní hodnota je neutrální obrázek, který nemá žádné odlišení. Integrací přechodu podél této cesty poskytuje integrované přechody míru, jak každá vstupní funkce přispívá k predikci, což umožňuje vygenerovat mapu přiřazení. Tato mapa zvýrazňuje nej vlivnější vstupní funkce a dá se použít k získání přehledu o rozhodovacím procesu modelu. Integrované přechody je možné použít k vysvětlení široké škály modelů hlubokého učení, včetně sítí CNN, sítí RNN a transformátorů. Navíc jde o teoreticky uzemněnou techniku, která splňuje sadu žádoucích vlastností, jako je citlivost, invariance implementace a úplnost.	AutoML (automatizované strojové učení)	Klasifikace více tříd obrázků, klasifikace více popisků obrázků
XRAI	XRAI je nová metoda saliency založená na oblastech založená na integrovaných přechodech (IG). Obrázek pře segmentuje a iterativním způsobem testuje důležitost jednotlivých oblastí a vynucuje menší oblasti do větších segmentů na základě skóre přisuzování. Tato strategie přináší vysoce kvalitní úzce vázané oblasti saliency, které mají vyšší výkon než stávající techniky saliency. XRAI lze použít s libovolným modelem založeným na DNN, pokud existuje způsob, jak seskupit vstupní funkce do segmentů prostřednictvím určité metriky podobnosti.	AutoML (automatizované strojové učení)	Klasifikace více tříd obrázků, klasifikace více popisků obrázků
D-RISE	D-RISE je modelově nezávislá metoda pro vytváření vizuálních vysvětlení předpovědí modelů rozpoznávání objektů. Díky účtování lokalizačních i kategorizačních aspektů detekce objektů může D-RISE vytvářet mapy saliency, které zvýrazňují části obrázku, které nejvíce přispívají k predikci detektoru. Na rozdíl od přechodových metod je D-RISE obecnější a nepotřebuje přístup k vnitřnímu fungování detektoru objektů; vyžaduje přístup pouze ke vstupům a výstupům modelu. Metodu lze použít u jednofázových detektorů (například YOLOv3), dvoufázových detektorů (například Faster-RCNN) a Vision Transformers (například DETR, OWL-ViT). D-Rise poskytuje mapu sliency vytvořením náhodných masek vstupního obrázku a odešle ji do detektoru objektů s náhodnými maskami vstupního obrázku. Posouzením změny skóre detektoru objektů agreguje všechny detekce s každou maskou a vytvoří konečnou mapu sliency.	Nezávislá na modelu	Rozpoznávání objektů

Další kroky

Zjistěte, jak vygenerovat řídicí panel zodpovědné umělé inteligence prostřednictvím rozhraní příkazového řádku v2 a sady SDK verze 2 nebo uživatelského rozhraní studio Azure Machine Learning.
Prozkoumejte podporované vizualizace interpretovatelnosti řídicího panelu Zodpovědné umělé inteligence.
Zjistěte, jak vygenerovat přehled výkonnostních metrik Zodpovědné AI na základě přehledů zjištěných na řídicím panelu Zodpovědné umělé inteligence.