Důležitost funkce permutací

Tento článek popisuje, jak použít komponentu Důležitost funkce permutace v návrháři služby Azure Machine Learning k výpočtu sady skóre důležitosti funkcí pro vaši datovou sadu. Tato skóre vám pomůžou určit nejlepší funkce, které se mají v modelu použít.

V této komponentě se hodnoty funkcí náhodně prohazují po jednom sloupci. Výkon modelu se měří před a po. K měření výkonu můžete zvolit jednu ze standardních metrik.

Skóre, která komponenta vrací, představují změnu výkonu natrénovaného modelu po permutaci. Důležité funkce jsou obvykle citlivější na proces náhodného prohazování, takže budou mít za následek vyšší skóre důležitosti.

Tento článek obsahuje přehled funkce permutace, jejího teoretického základu a jejích aplikací ve strojovém učení: Důležitost funkce permutace.

Jak používat důležitost funkce permutace

Generování sady skóre funkcí vyžaduje, abyste už měli natrénovaný model a také testovací datovou sadu.

  1. Přidejte do kanálu komponentu Důležitost funkce permutace. Tuto komponentu najdete v kategorii Výběr funkce .

  2. Připojení vytrénovaného modelu k levému vstupu Model musí být regresní nebo klasifikační model.

  3. Na pravém vstupu připojte datovou sadu. Pokud možno zvolte jinou datovou sadu, než je datová sada, kterou jste použili k trénování modelu. Tato datová sada se používá k bodování na základě vytrénovaného modelu. Používá se také k vyhodnocení modelu po změně hodnot funkcí.

  4. Do pole Náhodné počáteční hodnoty zadejte hodnotu, která se použije jako počáteční hodnota pro náhodnost. Pokud zadáte 0 (výchozí), vygeneruje se číslo na základě systémových hodin.

    Počáteční hodnota je volitelná, ale pokud chcete reprodukovatelnost napříč spuštěními stejného kanálu, měli byste ji zadat.

  5. V části Metrika pro měření výkonu vyberte jednu metriku, která se má použít při výpočtu kvality modelu po permutaci.

    Návrhář Azure Machine Learning podporuje následující metriky v závislosti na tom, jestli vyhodnocujete klasifikační nebo regresní model:

    • Classification

      Přesnost, přesnost, úplnost

    • Regrese

      Přesnost, úplnost, střední absolutní chyba, kořen střední kvadratická chyba, relativní absolutní chyba, relativní kvadratická chyba, koeficient určení

    Podrobnější popis těchto metrik vyhodnocení a způsob jejich výpočtu najdete v tématu Vyhodnocení modelu.

  6. Odešlete kanál.

  7. Komponenta vypíše seznam sloupců funkcí a skóre, která jsou k nim přidružená. Seznam je seřazen sestupně podle skóre.

Technické poznámky

Permutační důležitost funkce funguje tak, že náhodně mění hodnoty jednotlivých sloupců funkcí, vždy po jednom sloupci. Pak model vyhodnotí.

Pořadí, které komponenta poskytuje, se často liší od pořadí, které získáte při výběru funkce na základě filtru. Výběr funkce na základě filtru vypočítá skóre před vytvořením modelu.

Rozdíl je v tom, že permutační důležitost funkce neměří přidružení mezi funkcí a cílovou hodnotou. Místo toho zaznamenává, jak velký vliv má každá funkce na predikce modelu.

Další kroky

Podívejte se na sadu komponent dostupných pro Azure Machine Learning.