Jagamisviis:


Kategooriate klassifikatsioonimudeli toimivuse parandamine

Kui teie mudeli jõudlus ei ole seal, kus soovite, võite proovida mõnda asja. Need näpunäited aitavad teil mudelit kohandada, et parandada selle ennustusvõimet.

Lisage rohkem õigesti märgistatud treeningandmeid

Mida õigemini märgistatud treeningandmed teil on, seda paremini teie mudel toimib. Oletame näiteks, et teil on silt Jah/ei. Kui enamikul teie andmetest on selles veerus ainult Jah , ei õpi teie tehisintellekti mudel neist andmetest tõenäoliselt palju. Kui teie andmed pole õigesti märgistatud, ei õpi mudel tõenäoliselt eriti hästi. Ideaalne on alustada väikese komplekti õigesti märgistatud näidetega - võib-olla 100 või vähem. Sealt saate jätkata näidete arvu iteratiivselt kahekordistamist ja iga kord uuesti treenida, märkides jõudluse muutust. Üldiselt on rohkem andmeid parem, kuid andmete lisamise tulu väheneb, mida suuremaks teie andmestik muutub.

Veel näpunäiteid

  • Veendu, et siltide kasutamine on treeninguandmetes tasakaalus. Näiteks: Teil on 100 tekstiüksuse jaoks neli silti. Kahte esimest silti (tag1 ja tag2) kasutatakse 90 tekstiüksuse jaoks, kuid ülejäänud kahte (tag3 ja tag4) kasutatakse ainult ülejäänud 10 tekstiüksuse puhul. Tasakaalu puudumine võib põhjustada teie mudelil raskusi siltide 3 või tag4 õigel ennustamisel .
  • Veenduge, et treenite oma mudelit andmetega, mis on sarnased sellega, milleks kavatsete mudelit kasutada.

Järgmine etapp

Kategooriate klassifikatsioonimudeli avaldamine

Kategooriate klassifikatsiooni eelehitatud mudel