Sdílet prostřednictvím


Důležitost funkce permutací

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Vypočítá skóre funkce permutace skóre funkcí s ohledem na trained model a testovací datovou sadu.

Kategorie: moduly výběru funkcí

Poznámka

platí pro: jenom Machine Learning Studio (classic)

podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.

Přehled modulu

tento článek popisuje, jak použít modul důležitost funkcí permutace v aplikaci Machine Learning Studio (classic) k výpočtu sady výsledků důležitosti funkcí pro datovou sadu. Tato skóre vám pomůžou určit nejlepší funkce pro použití v modelu.

V tomto modulu jsou hodnoty funkcí náhodně přemístěné, jeden sloupec v čase a výkon modelu se měří před a po. Můžete zvolit jednu ze standardních metrik, které jsou k dispozici pro měření výkonu.

Skóre, které modul vrací, představuje změnu výkonu pro vyškolený model po permutaci. Důležité funkce jsou obvykle citlivější na proces náhodného zpracování a výsledkem bude vyšší důležitost.

Tento článek poskytuje dobrý obecný přehled důležitosti funkcí permutace, teoreticky a jeho aplikací ve strojovém učení: Permutace – důležitost funkcí

Použití funkce permutace důležitost

Aby bylo možné vygenerovat sadu výsledků funkcí, je nutné mít již vyškolený model i testovací datovou sadu.

  1. Přidejte modul důležitosti funkce permutace do experimentu. Tento modul můžete najít v kategorii výběru funkcí .

  2. pro levý vstup Připojení školený model. Model musí být regresní model nebo model klasifikace.

  3. Ve správném vstupu připojte datovou sadu, nejlépe tu, která se liší od datové sady použité pro školení modelu. Tato datová sada se používá pro hodnocení založené na škole modelu a pro vyhodnocení modelu po změně hodnot funkcí.

  4. V případě náhodného osazenízadejte hodnotu, která se má použít jako počáteční hodnota pro náhodnost. Pokud zadáte 0 (výchozí), vygeneruje se číslo na základě systémových hodin.

    Hodnota počáteční hodnoty je volitelná, ale měli byste zadat hodnotu, pokud chcete mít reprodukovatelnost v průběhu stejného experimentu.

  5. Pro metriku pro měření výkonuvyberte jednu metriku, která se použije při výpočtu kvality modelu po permutaci.

    Machine Learning Studio (classic) podporuje následující metriky v závislosti na tom, jestli vyhodnocujete model klasifikace nebo regrese:

    • Classification

      Přesnost, přesnost, odvolání, průměrná ztráta protokolu

    • Regrese

      Přesnost, odvolání, Přibližná absolutní chyba, hlavní střední hodnota chyby, relativní absolutní chyba, relativní navýšení chyby, koeficient stanovitelnosti

    Podrobnější popis těchto metrik vyhodnocení a jejich výpočtu naleznete v tématu Evaluate.

  6. Spusťte experiment.

  7. Modul vytvoří výstup seznamu sloupců funkcí a skóre, která jsou k nim přidružená, seřazené podle skóre, sestupné.

Příklady

Podívejte se na tyto ukázkové experimenty v Azure AI Gallery:

Technické poznámky

V této části najdete podrobné informace o implementaci, tipy a odpovědi na nejčastější dotazy.

Jak to dělá porovnání s jinými metodami výběru funkcí?

Funkce permutace: význam funguje náhodným změnou hodnot každého sloupce funkce, jednoho sloupce v čase a následným vyhodnocením modelu.

Klasifikace funkce permutace je často odlišná od těch, které dostanete z výběru funkce založeného na filtru, který počítá skóre před vytvořením modelu.

Důvodem je to, že důležitost funkcí permutace neměří přidružení mezi funkcí a cílovou hodnotou, ale místo toho zachycuje, jak velká mají jednotlivé funkce v předpovědi z modelu.

Očekávané vstupy

Název Typ Description
Školený model Rozhraní ILearner Vyškolený model klasifikace nebo regrese
Testovací data Tabulka dat Testovací sada pro bodování a vyhodnocení modelu po permutaci hodnot funkcí

Parametry modulu

Název Typ Rozsah Volitelné Výchozí Description
Náhodné osazení Integer >= 0 Vyžadováno 0 Počáteční hodnota generátoru náhodných čísel
Metrika pro měření výkonu EvaluationMetricType vybrat ze seznamu Vyžadováno Přesnost klasifikace Vyberte metriku, která se má použít při vyhodnocení proměnlivosti modelu po permutacích.

Výstupy

Název Typ Description
Důležitost funkce Tabulka dat Datová sada obsahující výsledky důležité funkce na základě vybrané metriky

Výjimky

Výjimka Description
Chyba 0062 Při pokusu o porovnání dvou modelů s různými typy informací dojde k výjimce.
Chyba 0024 K výjimce dojde, pokud datová sada neobsahuje sloupec popisku.
Chyba 0105 Vyvoláno, když definiční soubor modulu definuje typ parametru nepodporovaný.
Chyba 0021 K výjimce dojde v případě, že počet řádků v některých datových sadách předaných do modulu je příliš malý.

Viz také

Výběr funkcí
Výběr funkcí na základě filtrů
Analýza hlavní komponenty