Zlepšenie výkonu vášho modelu klasifikácie kategórie

Ak výkon vášho modelu nedosahuje požadovanú úroveň, môžete vyskúšať niekoľko vecí. Tieto tipy vám pomôžu vylepšiť model a zlepšiť tak jeho prediktívny výkon.

Pridanie ďalších správne označených tréningových údajov

Čím správnejšie údaje o trénovaní máte, tým lepší bude váš model. Povedzme napríklad, že máte označenie Áno/Nie. Ak väčšina vašich údajov obsahuje v tomto stĺpci iba Áno , váš model AI sa z týchto údajov pravdepodobne veľa nenaučí. Ak vaše údaje nie sú správne označené, model sa pravdepodobne nebude dobre učiť. Najlepšie je začať malou množinou správne označených príkladov – približne 100 alebo menej. Ďalej môžete pokračovať zdvojnásobením počtu príkladov a zakaždým znovu trénovať, pričom zaznamenáte zmenu výkonu. Vo všeobecnosti možno povedať, že viac údajov je lepších, ale čím väčšia je vaša množina údajov, tým nižšia je návratnosť pridávaných údajov.

Ďalšie tipy

  • Uistite sa, že v tréningových údajoch je používanie značiek vyvážené. Napríklad: máte štyri značky na 100 textových položiek. Prvé dve značky (tag1 a tag2) sa používajú pre 90 textových položiek, ale ďalšie dve () sa používajú iba na zvyšných 10 textových položiek.tag3a tag4 Nedostatok rovnováhy môže spôsobiť, že váš model bude mať problém správne predpovedať tag3 alebo tag4.
  • Uistite sa, že svoj model trénujete pomocou údajov, ktoré sú podobné tým, na ktoré plánujete model použiť.

Nasledujúci krok

Zverejnite svoj model klasifikácie kategórií

Pozrite si tiež:

Predpripravený model klasifikácie kategórií