Sdílet prostřednictvím


Vylepšení výkonu modelu klasifikace kategorie

Pokud výkon vašeho modelu nedosahuje požadované hodnoty, můžete vyzkoušet několik věcí. Tyto tipy vám pomůžou s vyladěním modelu, aby se zlepšil jeho prediktivní výkon.

Přidání dalších správně označených trénovacích dat

Čím správnější údaje o tréninku máte, tím lepší bude váš model. Řekněme například, že máte štítek Ano / Ne. Pokud má většina vašich dat v tomto sloupci jenom hodnotu Ano, váš model AI se toho z těchto dat asi moc nenaučí. Pokud vaše data nejsou správně označena, model se pravděpodobně nebude dobře učit. Je ideální začít malou sadou správně označených příkladů - asi 100 nebo méně. Odtud můžete iterativně zdvojnásobit počet příkladů a pokaždé je opakovat, přičemž si všimnete změny výkonu. Obecně lze říci, že více dat je lepší, ale při přidávání dat se zmenšují vrácení při přidávání dat s tím, jak datová sada narůstá.

Další tipy

  • Ujistěte se, že je použití značek v datech trénování vyvážené. Například: Máte čtyři značky pro 100 textových položek. První dvě značky (tag1 a tag2) se používají pro 90 textových položek, ale další dvě (tag3 a tag4) se používají jenom ve zbývajících 10 textových položkách. Nedostatek rovnováhy může způsobit, že se váš model bude snažit správně předpovídat tag3 nebo tag4.
  • Ujistěte se, že trénujete svůj model pomocí dat, která jsou podobná tomu, pro co očekáváte, že jej použijete.

Další krok

Publikování modelu klasifikace kategorie

Předem vytvořený model klasifikace kategorií