Sdílet prostřednictvím


Úklid a výběr modelu pro prognózování v AutoML

Tento článek se zaměřuje na to, jak AutoML hledá a vybírá modely prognózování. Další obecné informace o metodologii prognózování v AutoML najdete v článku s přehledem metod. Pokyny a příklady pro trénování modelů prognóz v AutoML najdete v našem článku věnovaném nastavení AutoML pro prognózování časových řad.

Uklidování modelů

Centrální úlohou pro AutoML je trénování a vyhodnocování několika modelů a výběr nejlepšího modelu s ohledem na danou primární metriku. Slovo "model" zde odkazuje jak na třídu modelu ( například ARIMA nebo Náhodná doménová struktura), tak na konkrétní nastavení hyperparametrů, která rozlišují modely v rámci třídy. ARIMA například odkazuje na třídu modelů, které sdílejí matematickou šablonu a sadu statistických předpokladů. Trénování nebo přizpůsobení modelu ARIMA vyžaduje seznam kladných celých čísel, které určují přesnou matematickou formu modelu; jedná se o hyper-parametry. ARIMA(1, 0, 1) a ARIMA(2, 1, 2) mají stejnou třídu, ale různé hyperparametry, takže se dají samostatně přizpůsobit trénovacím datům a vyhodnotit je proti sobě. AutoML vyhledává nebo zamytává různé třídy modelu a v rámci tříd pomocí různých hyper-parametrů.

Následující tabulka ukazuje různé metody úklidu hyperparametrů, které AutoML používá pro různé třídy modelů:

Skupina tříd modelu Typ modelu Metoda úklidu hyperparametrů
Naive, Sezónní Naive, Průměr, Sezónní průměr Časové řady Bez úklidu v rámci třídy kvůli jednoduchosti modelu
Exponenciální vyhlazování, ARIMA(X) Časové řady Hledání mřížky pro úklid v rámci třídy
Prorok Regrese Bez úklidu v rámci třídy
Lineární SGD, LARS LARS LASSO, Elastic Net, K nejbližší sousedé, rozhodovací strom, náhodný les, extrémně randomizované stromy, gradientní zesílené stromy, lightGBM, XGBoost Regrese Služba doporučení modelu AutoML dynamicky zkoumá prostory hyperparametrů.
ForecastTCN Regrese Statický seznam modelů následovaný náhodným vyhledáváním podle velikosti sítě, poměru vyřazení a rychlosti učení

Popis různých typů modelů najdete v části modely prognózování v článku s přehledem metod.

Množství úklidu, které AutoML dělá, závisí na konfiguraci úlohy prognózy. Kritéria zastavení můžete zadat jako časový limit nebo limit počtu pokusů nebo ekvivalentní počet modelů. Logiku předčasného ukončení je možné použít v obou případech k zastavení úklidu, pokud se primární metrika nezlepšuje.

Výběr modelu

Vyhledávání a výběr modelu prognózy AutoML probíhá v následujících třech fázích:

  1. Uklidte modely časových řad a vyberte nejlepší model z každé třídy pomocí penalizovaných metod pravděpodobnosti.
  2. Přemístit regresní modely a zařadit je spolu s nejlepšími modely časových řad z fáze 1 podle jejich primárních hodnot metrik z ověřovacích sad.
  3. Vytvořte souborový model z nejlépe seřazených modelů, vypočítejte metriku ověření a seřadíte ho s ostatními modely.

Model s nejvyšší hodnotou metriky na konci fáze 3 je určen nejlepším modelem.

Důležité

Konečná fáze výběru modelu AutoML vždy počítá metriky na datech mimo výběr . To znamená, že data, která nebyla použita k přizpůsobení modelů. To pomáhá chránit před přetáčením.

AutoML má dvě konfigurace ověřování – křížové ověření a explicitní ověřovací data. V případě křížového ověření používá AutoML vstupní konfiguraci k vytvoření dat rozdělených na trénovací a ověřovací záhyby. Časové pořadí musí být zachováno v těchto rozděleních, takže AutoML používá tzv . průběžné ověřování původu, které rozděluje řadu na trénovací a ověřovací data pomocí počátečního časového bodu. Posunutím počátku v čase se vygenerují křížové záhyby křížového ověření. Každý ověřovací složený záhyb obsahuje další horizont pozorování bezprostředně za umístěním původu pro danou složenou záhybu. Tato strategie zachovává integritu dat časové řady a snižuje riziko úniku informací.

Diagram znázorňující překládání křížového ověření oddělující trénovací a ověřovací sady na základě velikosti kroku křížového ověření

AutoML se řídí obvyklým postupem křížového ověření, trénováním samostatného modelu na každém záhybu a průměrováním ověřovacích metrik ze všech složených záhybů.

Křížové ověřování pro úlohy prognózování se konfiguruje nastavením počtu záhybů křížového ověření a volitelně počtu časových období mezi dvěma po sobě jdoucími složenými křížovými ověřeními. Další informace a příklad konfigurace křížového ověřování pro prognózování najdete v průvodci nastavením křížového ověření.

Můžete také použít vlastní ověřovací data. Další informace najdete v článku Konfigurace rozdělení dat a křížového ověřování v článku AutoML (SDK v1).

Další kroky