Sdílet prostřednictvím


Důležitost funkce permutací

Tento článek popisuje, jak pomocí komponenty Důležitost funkce permutation v návrháři služby Azure Machine Learning vypočítat sadu skóre důležitosti funkcí pro vaši datovou sadu. Pomocí těchto skóre můžete určit nejlepší funkce, které se mají použít v modelu.

V této komponentě jsou hodnoty funkcí náhodně zahazované, jeden sloupec najednou. Výkon modelu se měří před a po. Můžete zvolit jednu ze standardních metrik pro měření výkonu.

Skóre, která komponenta vrátí, představují změnu výkonu natrénovaného modelu po permutaci. Důležité funkce jsou obvykle citlivější na proces náhodného prohazování, takže výsledkem budou vyšší skóre důležitosti.

Tento článek obsahuje přehled funkce permutace, její teoretické základy a aplikací ve strojovém učení: Důležitost funkce permutace.

Jak používat důležitost funkce permutace

Generování sady skóre funkcí vyžaduje, abyste měli už natrénovaný model a také testovací datovou sadu.

  1. Přidejte do kanálu komponentu Důležitost funkce Permutation. Tuto komponentu najdete v kategorii Výběr funkcí.

  2. Připojení vytrénovaného modelu k levému vstupu Model musí být regresní model nebo klasifikační model.

  3. Na správném vstupu připojte datovou sadu. Pokud možno vyberte jinou datovou sadu než datovou sadu, kterou jste použili k trénování modelu. Tato datová sada se používá k bodování na základě natrénovaného modelu. Používá se také k vyhodnocení modelu po změně hodnot funkcí.

  4. Do pole Náhodné počáteční hodnoty zadejte hodnotu, která se má použít jako počáteční hodnota pro randomizaci. Pokud zadáte hodnotu 0 (výchozí), vygeneruje se číslo na základě systémových hodin.

    Počáteční hodnota je nepovinná, ale pokud chcete reprodukovatelnost napříč spuštěními stejného kanálu, měli byste zadat hodnotu.

  5. Pro metriku pro měření výkonu vyberte jednu metriku, kterou chcete použít při výpočetní kvalitě modelu po permutaci.

    Návrhář služby Azure Machine Learning podporuje následující metriky v závislosti na tom, jestli vyhodnocujete klasifikační nebo regresní model:

    • Klasifikace

      Přesnost, přesnost, úplnost

    • Regrese

      Přesnost, úplnost, střední absolutní chyba, odmocnina střední kvadratická chyba, relativní absolutní chyba, relativní kvadratická chyba, koeficient určení

    Podrobnější popis těchto metrik vyhodnocení a jejich výpočtu najdete v tématu Vyhodnocení modelu.

  6. Odešlete kanál.

  7. Komponenta vypíše seznam sloupců funkcí a skóre přidružené k nim. Seznam je seřazený v sestupném pořadí výsledků.

Technické poznámky

Důležitost funkce permutace funguje tak, že náhodně mění hodnoty jednotlivých sloupců funkcí v jednom sloupci. Pak model vyhodnotí.

Pořadí, které komponenta poskytuje, se často liší od pořadí, které získáte z výběru funkcí založených na filtru. Výběr funkce založené na filtru vypočítá skóre před vytvořením modelu.

Důvodem rozdílu je, že důležitost funkce Permutation neměří přidružení mezi funkcí a cílovou hodnotou. Místo toho zachycuje, jaký vliv má každá funkce na předpovědi z modelu.

Další kroky

Podívejte se na sadu komponent dostupných pro Azure Machine Learning.