Sdílet prostřednictvím


One-Class podporuje vektorový počítač

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Vytvoří jednu třídu, která podporuje model vektorového počítače pro detekci anomálií.

Kategorie: detekce anomálií

Poznámka

platí pro: jenom Machine Learning Studio (classic)

podobné moduly přetažení jsou k dispozici v návrháři Azure Machine Learning.

Přehled modulu

tento článek popisuje, jak použít modul Vector model podpory s jednou třídou v Machine Learning studiu (classic) k vytvoření modelu detekce anomálií.

Tento modul je zvláště užitečný ve scénářích, kde máte spoustu "normálních" dat, a nemnoho případů anomálií, které se snažíte detekovat. Například pokud potřebujete zjistit podvodné transakce, možná nebudete mít mnoho příkladů podvodů, které byste mohli použít k vytvoření typického klasifikačního modelu, ale můžete mít mnoho příkladů dobrých transakcí.

Použijete modul vektorového modelu podpory s jednou třídou pro vytvoření modelu a potom pomocí modelu detekce anomáliíprovedete model. Datová sada, kterou používáte pro školení, může obsahovat všechny nebo převážně normální případy.

Pak můžete použít různé metriky a identifikovat potenciální anomálie. Například můžete použít velkou datovou sadu dobrých transakcí k identifikaci případů, které mohou představovat podvodné transakce.

Další informace o SVM jedné třídy

Podpora vektorových počítačů (SVMs) je pod dohledem výukových modelů, které analyzují data a rozpoznávají vzory a které je možné použít pro úlohy klasifikace i regrese.

SVM algoritmem je obvykle dána sada výukových příkladů označených jako patřící do jedné ze dvou tříd. Model SVM je založený na rozdělení školicích bodů ukázek do samostatných kategorií podle toho, co je to možné, a současně postihuje ukázky školicích kurzů, které spadají do špatné strany dané mezery. SVM model potom vytvoří předpovědi přiřazením bodů k jedné straně mezery nebo druhé.

V některých případech se pro replikaci stávajících ukázek používá převzorkování, takže můžete vytvořit model se dvěma třídami, ale není možné předpovědět všechny nové vzory podvodu nebo systémových chyb z omezených příkladů. Kromě toho může být shromažďování i omezených příkladů nákladné.

Proto je v rámci jedné třídy SVM vyškolený vektorový model podpory na data, která mají pouze jednu třídu, což je "normální" třídu. Odvodí vlastnosti normálních případů a z těchto vlastností může předpovědět, které příklady jsou na rozdíl od normálních příkladů. To je užitečné pro detekci anomálií, protože nedostatkem výukových příkladů je to, co definuje anomálie: to znamená, že obvykle existuje několik příkladů neoprávněného vniknutí do sítě, podvodů nebo jiných neobvyklé chování.

Další informace, včetně odkazů na základní výzkum, najdete v části technické poznámky .

Poznámka

Modul vektorového modelu podpory s jednou třídou vytvoří model SVM kernel, což znamená, že není velmi škálovatelný. Pokud je čas školení omezený nebo máte příliš mnoho dat, můžete použít jiné metody pro detekci anomálií, například detekci anomálií na základě DPS.

Postup konfigurace One-Class SVM

  1. Přidejte modul vektorového modelu podpory s jednou třídou do experimentu v studiu (Classic). modul můžete najít v části Machine Learning-Initializev kategorii detekce anomálií .

  2. Dvojím kliknutím na modul vektorového modelu podpory na jednu třídu otevřete podokno vlastnosti .

  3. V části vytvořit Trainer režimvyberte možnost, která indikuje, jak se má model vyškolet:

    • Jediný parametr: tuto možnost použijte, pokud víte, jak chcete model konfigurovat, a poskytněte konkrétní sadu hodnot jako argumenty.

    • Rozsah parametrů: tuto možnost použijte, pokud si nejste jisti nejlepšími parametry a chcete k vyhledání optimální konfigurace použít operaci sweep.

  4. η: zadejte hodnotu, která představuje horní mez podílu podmnožiny. Tento parametr odpovídá vlastnosti Nu popsané v tomto dokumentu. Vlastnost Nu umožňuje řídit kompromisy mezi odlehlémi a normálními případy.

  5. ε (Epsilon): zadejte hodnotu, která se má použít jako tolerance zastavení. Tolerance zastavení má vliv na počet iterací použitých při optimalizaci modelu a závisí na hodnotě kritéria zastavení. Při překročení hodnoty Trainer zastaví iteraci na řešení.

  6. Připojení datovou sadu školení a jeden z školicích modulů:

    Poznámka

    Pokud předáte rozsah parametrů pro analýzu modelu detekce anomálií, použije se v seznamu rozsah parametrů jenom první hodnota.

    Pokud předáte jednu sadu hodnot parametrů do modulu předparametrů modelu ladění , když očekává rozsah nastavení pro každý parametr, ignoruje hodnoty a použije výchozí hodnoty pro učit se.

    Pokud vyberete možnost rozsahu parametrů a pro libovolný parametr zadáte jedinou hodnotu, použije se tato jediná hodnota v celém období, a to i v případě, že se jiné parametry mění v rámci rozsahu hodnot.

  7. Spusťte experiment.

Výsledky

Modul vrací model detekce anomálií. Model můžete buď Uložit do svého pracovního prostoru, nebo můžete připojit modul bodového modelu a použít vycvičený model k detekci možných anomálií.

Pokud jste model využívali pomocí Sweep parametrů, poznamenejte si optimální nastavení parametrů pro použití při konfiguraci modelu pro použití v produkčním prostředí.

Příklady

Příklady toho, jak se tento modul používá při detekci anomálií, najdete v Azure AI Gallery:

  • Detekce anomálií: úvěrové riziko: v této ukázce se dozvíte, jak v datech najít odlehlé hodnoty, a to pomocí parametru Sweep k nalezení optimálního modelu. Pak tento model aplikuje na nová data, aby identifikoval rizikové transakce, které by mohly představovat podvod, a porovnávají dva různé modely detekce anomálií.

Technické poznámky

Předpovědi z SVM jedné třídy jsou nekalibrovaná skóre, která mohou být pravděpodobně bez vazby. jak ukazuje příklad v Cortana Intelligence Gallery, nezapomeňte normalizovat skóre, pokud porovnáváte modely založené na různých algoritmech.

Studoval

Tato implementace zabalí knihovnu pro podporu vektorových počítačů s názvem libsvm. Obecná teorie, na základě které libsvm je založena, a přístup k jednotlivým třídám Vector Machine support jsou popsány v těchto dokladech na základě B. Schӧlkopf et al.

Parametry modulu

Název Typ Rozsah Volitelné Description Výchozí
Vytvořit režim Trainer Vytvořit režim Trainer Seznam: jeden parametr | Rozsah parametrů Vyžadováno Jeden parametr Zadejte možnosti nástroje pro učení.

Pro ruční zadání všech hodnot použijte možnost SingleParameter .

K VyParameterRangeení parametrů přizpůsobitelné použijte možnost.
w Float >= Double. Kurzív Mode: jeden parametr 0.1 Tento parametr (reprezentovaný řeckým písmenem nu) určuje kompromis mezi zlomkem a počtem vektorů podpory.
kurzív Float >= Double. Kurzív Mode: jeden parametr 0,001 Určuje odolnost k zastavení.
psnu ParametrRangeSettings [0.001;1.0] mode:Rozsah parametrů 0.001; 0.01; 0.1 Určuje rozsah pro výměnu mezi zlomkem odlehlé hodnoty a počtem podpůrných vektorů.
psEpsilon ParametrRangeSettings [1e-6;1.0] mode:Rozsah parametrů 0.001; 0.01; 0.1 Určuje rozsah pro zastavení tolerance.

Výstupy

Název Typ Description
Model bez trénování ILearner – rozhraní Model detekce netrénovaných anomálií

Viz také

Classification
Trénování modelu detekce anomálií