Dela via


Träna en anpassad textklassificeringsmodell

Träning är den process där modellen lär sig av dina märkta data. När träningen är klar kan du visa modellens prestanda för att avgöra om du behöver förbättra din modell.

Om du vill träna en modell startar du ett träningsjobb. Endast slutförda jobb skapar en användbar modell. Träningsjobb upphör att gälla efter sju dagar. Efter den här perioden kan du inte hämta jobbinformationen. Om träningsjobbet har slutförts och en modell har skapats påverkas det inte av jobbets förfallodatum. Du kan bara ha ett träningsjobb i taget och du kan inte starta andra jobb i samma projekt.

Träningstiderna kan vara allt från några minuter när du hanterar få dokument, upp till flera timmar beroende på datauppsättningens storlek och schemats komplexitet.

Förutsättningar

Innan du tränar din modell behöver du:

Mer information finns i livscykeln för projektutveckling .

Datadelning

Innan du påbörjar träningsprocessen är märkta dokument i projektet indelade i en träningsuppsättning och en testuppsättning. Var och en av dem har olika funktioner. Träningsuppsättningen används för att träna modellen. Det här är den uppsättning som modellen lär sig klassen/klasserna som tilldelas till varje dokument. Testuppsättningen är en blinduppsättning som inte introduceras i modellen under träningen utan bara under utvärderingen. När modellen har tränats används den för att göra förutsägelser från dokumenten i testuppsättningen. Baserat på dessa förutsägelser beräknas modellens utvärderingsmått . Vi rekommenderar att du ser till att alla dina klasser är korrekt representerade i både tränings- och testuppsättningen.

Anpassad textklassificering stöder två metoder för datadelning:

  • Dela automatiskt upp testuppsättningen från träningsdata: Systemet delar upp dina märkta data mellan tränings- och testuppsättningarna enligt de procentsatser du väljer. Systemet kommer att försöka ha en representation av alla klasser i din träningsuppsättning. Den rekommenderade procentuella uppdelningen är 80 % för träning och 20 % för testning.

Anteckning

Om du väljer alternativet Dela upp testuppsättningen automatiskt från träningsdata delas endast de data som är tilldelade till träningsuppsättningen upp enligt de procentsatser som anges.

  • Använd en manuell delning av tränings- och testdata: Med den här metoden kan användare definiera vilka etiketterade dokument som ska tillhöra vilken uppsättning. Det här steget aktiveras bara om du har lagt till dokument i testuppsättningen under dataetiketteringen.

Träningsmodell

Så här börjar du träna din modell från Language Studio:

  1. Välj Träningsjobb på menyn till vänster.

  2. Välj Starta ett träningsjobb på den översta menyn.

  3. Välj Träna en ny modell och skriv in modellnamnet i textrutan. Du kan också skriva över en befintlig modell genom att välja det här alternativet och välja den modell som du vill skriva över från den nedrullningsbara menyn. Det går inte att ångra att skriva över en tränad modell, men det påverkar inte dina distribuerade modeller förrän du distribuerar den nya modellen.

    Skapa ett nytt träningsjobb

  4. Välj datadelningsmetod. Du kan välja Att automatiskt dela upp testuppsättningen från träningsdata där systemet delar upp dina märkta data mellan tränings- och testuppsättningarna, enligt de angivna procentsatserna. Du kan också använda en manuell delning av tränings- och testdata. Det här alternativet är bara aktiverat om du har lagt till dokument i testuppsättningen under dataetiketteringen. Mer information om datadelning finns i Träna en modell .

  5. Välj knappen Träna .

  6. Om du väljer träningsjobbets ID i listan visas ett sidofönster där du kan kontrollera träningsförloppet, jobbstatusen och annan information för det här jobbet.

    Anteckning

    • Endast träningsjobb som har slutförts genererar modeller.
    • Tiden det tar att träna modellen kan ta mellan några minuter och flera timmar baserat på storleken på dina etiketterade data.
    • Du kan bara köra ett träningsjobb i taget. Du kan inte starta ett annat träningsjobb i samma projekt förrän det pågående jobbet har slutförts.

Avbryt träningsjobb

Om du vill avbryta ett träningsjobb i Language Studio går du till sidan Träningsjobb . Välj det träningsjobb som du vill avbryta och välj Avbryt på den översta menyn.

Nästa steg

När träningen har slutförts kan du visa modellens prestanda för att eventuellt förbättra din modell om det behövs. När du är nöjd med din modell kan du distribuera den och göra den tillgänglig för klassificering av text.