Náhodné doménové struktury a výběr architektur

Dokončeno

Experimentování s architekturami je často klíčovým cílem vytváření efektivních moderních modelů. Udělali jsme to na základní úrovni s rozhodovacími stromy, ale jediný limit pro to je naše představivost a možná paměť našeho počítače. Ve skutečnosti, myšlení obecněji o rozhodovacích stromech vedlo k vysoce populární modelové architektuře, která snižuje jeho rozhodovací stromy tendenci k nadměrnému přizpůsobení dat.

Co je náhodná doménová struktura?

Náhodná doménová struktura je kolekce rozhodovacích stromů, které se používají společně k odhadu, který popisek vzorku má být přiřazen. Pokud bychom například chtěli vytrénovat náhodný les, abychom předpověděli vítěze medailí, můžeme trénovat 100 různých rozhodovacích stromů. K předpovědím bychom použili všechny stromy nezávisle. Tyto možnosti by efektivně "hlasovaly" pro to, zda by sportovci vyhráli medaili a poskytli konečné rozhodnutí.

Jak se natrénuje náhodná doménová struktura?

Náhodné doménové struktury jsou založené na myšlence, že zatímco jeden rozhodovací strom je vysoce zkreslený nebo přeučený, pokud vytrénujeme několik rozhodovacích stromů, budou zkreslené různými způsoby. To vyžaduje, aby každý strom byl trénován nezávisle a každý na mírně odlišné trénovací sadě.

Pro trénování jednoho rozhodovacího stromu se z celé trénovací sady extrahuje určitý počet vzorků – sportovců v našem scénáři. Každý vzorek lze vybrat více než jednou a proběhne to náhodně. Strom se pak vytrénuje standardním způsobem. Tento proces se opakuje pro každý strom. Vzhledem k tomu, že každý strom získá jinou kombinaci trénovacích příkladů, každý strom skončí natrénovaný a zkreslený, jinak než ostatní.

Výhody náhodné doménové struktury

Výkonnáhodnýchm strukturám je často působivý a proto je porovnání často nejvhodnější pro neurální sítě, což je další oblíbený a vysoce výkonný typ modelu Na rozdíl od neurálních sítí se modely náhodných doménových struktur snadno trénují: moderní architektury poskytují užitečné metody, které vám to umožňují provádět pouze v několika řádcích kódu. Náhodné doménové struktury jsou také rychlé k trénování a k dobrému výkonu nepotřebují velké datové sady. Odděluje je od neurálních sítí, které mohou často trvat minuty nebo dny, než se trénují, vyžadují značné zkušenosti a často vyžadují velmi velké datové sady. Rozhodnutí o architektuře pro náhodné doménové struktury jsou sice složitější než modely, jako je lineární regrese, mnohem jednodušší než neurální sítě.

Nevýhody náhodné doménové struktury

Hlavní nevýhodou náhodných doménových struktur je, že je obtížné pochopit. Konkrétně, i když jsou tyto modely plně transparentní – každý strom je možné zkontrolovat a pochopit – často obsahují tolik stromů, které to dělají, je prakticky nemožné.

Jak si tyto architektury přizpůsobím?

Podobně jako několik modelů mají náhodné doménové struktury různé možnosti architektury. Nejjednodušší je vzít v úvahu velikost lesa: kolik stromů je zapojeno, spolu s velikostí těchto stromů. Bylo by například možné požádat les, aby předpověděl vítěze medailí obsahujících 100 stromů, z nichž každý má maximální hloubku šesti uzlů. To znamená, že konečné rozhodnutí o tom, zda sportovce vyhraje medaili, musí být provedeno maximálně šest "if" prohlášení.

Jak jsme se už naučili, zvětšením velikosti stromu (z hlediska hloubky nebo počtu listů) se data, na která se trénují, bude pravděpodobnější. Toto omezení platí také pro náhodné doménové struktury. S náhodnými doménovými strukturami to však můžeme čítače zvýšit počtem stromů za předpokladu, že každý strom bude zkreslený jiným způsobem. Každý strom můžeme také omezit pouze na určitý počet funkcí, nebo zakázat vytváření listů, když by byl pouze mezní rozdíl v výkonu trénování. Schopnost náhodné doménové struktury provádět dobré předpovědi není nekonečná. V určitém okamžiku zvětšení velikosti a počtu stromů nepřidá žádné další vylepšení kvůli omezené škále trénovacích dat, která máme.