Träna din modell för förståelse av konversationsspråk

Artikel
10/16/2024

När du har slutfört etikettering av dina yttranden kan du börja träna en modell. Träning är den process där modellen lär sig av dina märkta yttranden.

Om du vill träna en modell startar du ett träningsjobb. Endast slutförda jobb skapar en modell. Träningsjobb upphör att gälla efter sju dagar, efter den här tiden kommer du inte längre att kunna hämta jobbinformationen. Om ditt träningsjobb har slutförts och en modell har skapats påverkas det inte av att jobbet upphör att gälla. Du kan bara ha ett träningsjobb i taget och du kan inte starta andra jobb i samma projekt.

Träningstiderna kan vara var som helst från några sekunder när du hanterar enkla projekt, upp till ett par timmar när du når den maximala gränsen för yttranden.

Modellutvärdering utlöses automatiskt när träningen har slutförts. Utvärderingsprocessen börjar med att använda den tränade modellen för att köra förutsägelser på yttrandena i testuppsättningen och jämför de förutsagda resultaten med de angivna etiketterna (som upprättar en baslinje för sanning).

Förutsättningar

Ett projekt som har skapats med ett konfigurerat Azure Blob Storage-konto
Märkta yttranden

Balansera träningsdata

När det gäller träningsdata kan du försöka hålla schemat väl balanserat. Att inkludera stora mängder av en avsikt och mycket få av en annan resulterar i en modell som är partisk mot vissa avsikter.

För att hantera det här scenariot kan du behöva göra en nedsampling av träningsuppsättningen. Eller så kan du behöva lägga till det. Om du vill göra en nedsampling kan du:

Bli av med en viss procentandel av träningsdata slumpmässigt.
Analysera datamängden och ta bort överrepresenterade duplicerade poster, vilket är ett mer systematiskt sätt.

Om du vill lägga till träningsuppsättningen går du till Language Studio och väljer Föreslå yttranden på fliken Dataetiketter. Conversational Language Understanding skickar ett anrop till Azure OpenAI för att generera liknande yttranden.

Du bör också leta efter oavsiktliga "mönster" i träningsuppsättningen. Titta till exempel för att se om träningsuppsättningen för en viss avsikt bara är gemener eller börjar med en viss fras. I sådana fall kan den modell som du tränar lära sig dessa oavsiktliga fördomar i träningsuppsättningen i stället för att kunna generalisera.

Vi rekommenderar att du introducerar mångfald av höljen och skiljetecken i träningsuppsättningen. Om din modell förväntas hantera variationer måste du ha en träningsuppsättning som också återspeglar den mångfalden. Ta till exempel med några yttranden i rätt hölje och vissa i alla gemener.

Datadelning

Innan du påbörjar träningsprocessen delas märkta yttranden i projektet in i en träningsuppsättning och en testuppsättning. Var och en av dem har olika funktioner. Träningsuppsättningen används för att träna modellen. Det här är den uppsättning som modellen lär sig de märkta yttrandena från. Testuppsättningen är en blinduppsättning som inte introduceras i modellen under träningen utan bara under utvärderingen.

När modellen har tränats kan modellen användas för att göra förutsägelser från yttrandena i testuppsättningen. Dessa förutsägelser används för att beräkna utvärderingsmått. Vi rekommenderar att du ser till att alla dina avsikter och entiteter är tillräckligt representerade i både tränings- och testuppsättningen.

Förståelse av konversationsspråk stöder två metoder för datadelning:

Dela automatiskt upp testuppsättningen från träningsdata: Systemet delar dina taggade data mellan tränings- och testuppsättningarna enligt de procentsatser du väljer. Den rekommenderade procentuella uppdelningen är 80 % för träning och 20 % för testning.

Kommentar

Om du väljer alternativet Dela upp testuppsättningen automatiskt från träningsdata delas endast de data som tilldelats träningsuppsättningen upp enligt de procentsatser som anges.

Använd en manuell uppdelning av tränings- och testdata: Med den här metoden kan användarna definiera vilka yttranden som ska tillhöra vilken uppsättning. Det här steget aktiveras bara om du har lagt till yttranden i testuppsättningen under etikettering.

Träningslägen

CLU har stöd för två lägen för träning av dina modeller

Standardträningen använder snabba maskininlärningsalgoritmer för att träna dina modeller relativt snabbt. Detta är för närvarande endast tillgängligt för engelska och är inaktiverat för alla projekt som inte använder engelska (USA) eller engelska (Storbritannien) som primärt språk. Det här träningsalternativet är kostnadsfritt. Med standardträning kan du lägga till yttranden och testa dem snabbt utan kostnad. Utvärderingspoängen som visas bör vägleda dig om var du kan göra ändringar i projektet och lägga till fler yttranden. När du har itererat några gånger och gjort stegvisa förbättringar kan du överväga att använda avancerad utbildning för att träna en annan version av din modell.
Avancerad utbildning använder det senaste inom maskininlärningsteknik för att anpassa modeller med dina data. Detta förväntas visa bättre prestandapoäng för dina modeller och gör att du även kan använda de flerspråkiga funktionerna i CLU. Avancerad utbildning prissätts på olika sätt. Mer information finns i prisinformationen.

Använd utvärderingspoängen för att vägleda dina beslut. Det kan finnas tillfällen då ett specifikt exempel förutsägs felaktigt i avancerad träning i stället för när du använde standardträningsläge. Men om de övergripande utvärderingsresultaten är bättre med avancerat rekommenderar vi att du använder din slutliga modell. Om så inte är fallet och du inte vill använda flerspråkiga funktioner kan du fortsätta att använda modellen som tränats med standardläge.

Kommentar

Du bör förvänta dig att se en skillnad i beteenden i avsiktens konfidenspoäng mellan träningslägena när varje algoritm kalibrerar sina poäng på olika sätt.

Så här börjar du träna din modell inifrån Language Studio:

Välj Träna modell på menyn till vänster.
Välj Starta ett träningsjobb på den översta menyn.
Välj Träna en ny modell och ange ett nytt modellnamn i textrutan. Om du vill ersätta en befintlig modell med en modell som tränats på nya data väljer du Skriv över en befintlig modell och väljer sedan en befintlig modell. Att skriva över en tränad modell är oåterkalleligt, men det påverkar inte dina distribuerade modeller förrän du distribuerar den nya modellen.
Välj träningsläge. Du kan välja Standardträning för snabbare träning, men det är bara tillgängligt för engelska. Eller så kan du välja Avancerad utbildning som stöds för andra språk och flerspråkiga projekt, men det innebär längre utbildningstider. Läs mer om träningslägen.
Välj en datadelningsmetod . Du kan välja Att automatiskt dela upp testuppsättningen från träningsdata där systemet delar upp dina yttranden mellan tränings- och testuppsättningarna, enligt de angivna procentandelarna. Eller så kan du använda en manuell uppdelning av tränings- och testdata. Det här alternativet är bara aktiverat om du har lagt till yttranden i testuppsättningen när du etiketterade dina yttranden.
Välj knappen Träna.
Välj träningsjobbets ID i listan. En panel visas där du kan kontrollera träningsförloppet, jobbstatusen och annan information för det här jobbet.
Kommentar
- Endast slutförda träningsjobb genererar modeller.
- Träningen kan ta lite tid mellan ett par minuter och ett par timmar baserat på antalet yttranden.
- Du kan bara köra ett träningsjobb i taget. Du kan inte starta andra träningsjobb i samma projekt förrän jobbet som körs har slutförts.
- Den maskininlärning som används för att träna modeller uppdateras regelbundet. Om du vill träna på en tidigare konfigurationsversion väljer du Välj här om du vill ändra från sidan Starta ett träningsjobb och välja en tidigare version.

Starta träningsjobbet

Skapa en POST-begäran med hjälp av följande URL, rubriker och JSON-brödtext för att skicka ett träningsjobb.

Begärans-URL

Använd följande URL när du skapar din API-begäran. Ersätt platshållarvärdena med dina egna värden.

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/:train?api-version={API-VERSION}

Platshållare	Värde	Exempel
`{ENDPOINT}`	Slutpunkten för att autentisera din API-begäran.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Namnet på projektet. Det här värdet är skiftlägeskänsligt.	`EmailApp`
`{API-VERSION}`	Den version av API:et som du anropar.	`2023-04-01`

Sidhuvuden

Använd följande rubrik för att autentisera din begäran.

Tangent	Värde
`Ocp-Apim-Subscription-Key`	Nyckeln till resursen. Används för att autentisera dina API-begäranden.

Begärandetext

Använd följande objekt i din begäran. Modellen namnges efter det värde som du använder för parametern modelLabel när träningen är klar.

{
  "modelLabel": "{MODEL-NAME}",
  "trainingMode": "{TRAINING-MODE}",
  "trainingConfigVersion": "{CONFIG-VERSION}",
  "evaluationOptions": {
    "kind": "percentage",
    "testingSplitPercentage": 20,
    "trainingSplitPercentage": 80
  }
}

Nyckel	Platshållare	Värde	Exempel
`modelLabel`	`{MODEL-NAME}`	Namnet på din modell.	`Model1`
`trainingConfigVersion`	`{CONFIG-VERSION}`	Träningskonfigurationsmodellens version. Som standard används den senaste modellversionen .	`2022-05-01`
`trainingMode`	`{TRAINING-MODE}`	Träningsläget som ska användas för träning. Lägen som stöds är Standardträning, snabbare utbildning, men endast tillgängliga för engelska och avancerad utbildning som stöds för andra språk och flerspråkiga projekt, men omfattar längre utbildningstider. Läs mer om träningslägen.	`standard`
`kind`	`percentage`	Dela upp metoder. Möjliga värden är `percentage` eller `manual`. Mer information finns i träna en modell .	`percentage`
`trainingSplitPercentage`	`80`	Procentandel av dina taggade data som ska ingå i träningsuppsättningen. Rekommenderat värde är `80`.	`80`
`testingSplitPercentage`	`20`	Procentandel av dina taggade data som ska ingå i testuppsättningen. Rekommenderat värde är `20`.	`20`

Kommentar

Och trainingSplitPercentage testingSplitPercentage krävs endast om Kind anges till percentage och summan av båda procentandelarna ska vara lika med 100.

När du har skickat din API-begäran får du ett 202 svar som anger att det har lyckats. Extrahera värdet i svarshuvudena operation-location . Den formateras så här:

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}?api-version={API-VERSION}

Du kan använda den här URL:en för att hämta träningsjobbets status.

Hämta status för träningsjobb

Träningen kan ta en stund beroende på storleken på dina träningsdata och schemats komplexitet. Du kan använda följande begäran för att fortsätta avsöka statusen för träningsjobbet tills det har slutförts.

När du skickar en lyckad utbildningsbegäran finns den fullständiga begärande-URL:en för att kontrollera jobbets status (inklusive din slutpunkt, projektnamn och jobb-ID) i svarets operation-location huvud.

Använd följande GET-begäran för att få status för din modells träningsförlopp. Ersätt platshållarvärdena nedan med dina egna värden.

Begärans-URL

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}?api-version={API-VERSION}

Platshållare	Värde	Exempel
`{YOUR-ENDPOINT}`	Slutpunkten för att autentisera din API-begäran.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Namnet på projektet. Det här värdet är skiftlägeskänsligt.	`EmailApp`
`{JOB-ID}`	ID:t för att hitta modellens träningsstatus.	`xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx`
`{API-VERSION}`	Den version av API:et som du anropar.	`2023-04-01`

Sidhuvuden

Använd följande rubrik för att autentisera din begäran.

Tangent	Värde
`Ocp-Apim-Subscription-Key`	Nyckeln till resursen. Används för att autentisera dina API-begäranden.

Svarstext

När du har skickat begäran får du följande svar. Fortsätt att avsöka den här slutpunkten tills statusparametern ändras till "lyckades".

{
  "result": {
    "modelLabel": "{MODEL-LABEL}",
    "trainingConfigVersion": "{TRAINING-CONFIG-VERSION}",
    "trainingMode": "{TRAINING-MODE}",
    "estimatedEndDateTime": "2022-04-18T15:47:58.8190649Z",
    "trainingStatus": {
      "percentComplete": 3,
      "startDateTime": "2022-04-18T15:45:06.8190649Z",
      "status": "running"
    },
    "evaluationStatus": {
      "percentComplete": 0,
      "status": "notStarted"
    }
  },
  "jobId": "xxxxx-xxxxx-xxxx-xxxxx-xxxx",
  "createdDateTime": "2022-04-18T15:44:44Z",
  "lastUpdatedDateTime": "2022-04-18T15:45:48Z",
  "expirationDateTime": "2022-04-25T15:44:44Z",
  "status": "running"
}

Tangent	Värde	Exempel
`modelLabel`	Modellnamnet	`Model1`
`trainingConfigVersion`	Träningskonfigurationsversionen. Som standard används den senaste versionen .	`2022-05-01`
`trainingMode`	Ditt valda träningsläge.	`standard`
`startDateTime`	Tidsträningen startade	`2022-04-14T10:23:04.2598544Z`
`status`	Status för träningsjobbet	`running`
`estimatedEndDateTime`	Beräknad tid för att träningsjobbet ska slutföras	`2022-04-14T10:29:38.2598544Z`
`jobId`	Ditt träningsjobbs-ID	`xxxxx-xxxx-xxxx-xxxx-xxxxxxxxx`
`createdDateTime`	Datum och tid för att skapa utbildningsjobb	`2022-04-14T10:22:42Z`
`lastUpdatedDateTime`	Träningsjobbet uppdaterades senast datum och tid	`2022-04-14T10:23:45Z`
`expirationDateTime`	Förfallodatum och tid för träningsjobb	`2022-04-14T10:22:42Z`

Avbryt träningsjobbet

Language Studio
REST API:er

Så här avbryter du ett träningsjobb från Language Studio

På sidan Träna modell väljer du det träningsjobb som du vill avbryta och väljer Avbryt på den översta menyn.

Skapa en POST-begäran med hjälp av följande URL, rubriker och JSON-brödtext för att avbryta ett träningsjobb.

Begärans-URL

Använd följande URL när du skapar din API-begäran. Ersätt platshållarvärdena nedan med dina egna värden.

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}/:cancel?api-version={API-VERSION}

Platshållare	Värde	Exempel
`{ENDPOINT}`	Slutpunkten för att autentisera din API-begäran.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Namnet på projektet. Det här värdet är skiftlägeskänsligt.	`EmailApp`
`{JOB-ID}`	Det här är träningsjobbets ID.	`XXXXX-XXXXX-XXXX-XX`
`{API-VERSION}`	Den version av API:et som du anropar.	`2023-04-01`

Sidhuvuden

Använd följande rubrik för att autentisera din begäran.

Tangent	Värde
`Ocp-Apim-Subscription-Key`	Nyckeln till resursen. Används för att autentisera dina API-begäranden.

När du har skickat din API-begäran får du ett 202-svar som anger att det lyckades, vilket innebär att ditt träningsjobb har avbrutits. Ett lyckat anrop resulterar i ett Operation-Location huvud som används för att kontrollera jobbets status.

Nästa steg

Mått för modellutvärdering

Dela via

Träna din modell för förståelse av konversationsspråk

Förutsättningar

Balansera träningsdata

Datadelning

Träningslägen

Träna en modell

Starta träningsjobbet

Begärans-URL

Sidhuvuden

Begärandetext

Hämta status för träningsjobb

Begärans-URL

Sidhuvuden

Svarstext

Avbryt träningsjobbet

Begärans-URL

Sidhuvuden

Nästa steg

Feedback

Ytterligare resurser