Eseguire il training del modello di comprensione del linguaggio conversazionale

Articolo
12/19/2023

Dopo aver completato l'etichettatura delle espressioni, è possibile avviare il training di un modello. Il training è il processo in cui il modello apprende dalle espressioni etichettate.

Per eseguire il training di un modello, avviare un processo di training. Solo i processi completati creano un modello. I processi di training scadono dopo sette giorni, dopo questa volta non sarà più possibile recuperare i dettagli del processo. Se il processo di training è stato completato correttamente e un modello è stato creato, non sarà interessato dalla scadenza del processo. È possibile avere un solo processo di training in esecuzione alla volta e non è possibile avviare altri processi nello stesso progetto.

I tempi di training possono essere ovunque da pochi secondi quando si gestiscono progetti semplici, fino a un paio di ore quando si raggiunge il limite massimo di espressioni.

La valutazione del modello viene attivata automaticamente dopo il completamento del training. Il processo di valutazione inizia usando il modello sottoposto a training per eseguire stime sulle espressioni nel set di test e confronta i risultati stimati con le etichette fornite (che stabilisce una baseline di verità).

Prerequisiti

Un progetto creato correttamente con un account di archiviazione BLOB di Azure configurato
Espressioni etichettate

Bilanciare i dati di training

È consigliabile provare a mantenere lo schema ben bilanciato quando si tratta di dati di training. L'inclusione di grandi quantità di una finalità e molto poche di altre comportano un modello fortemente distorto verso finalità specifiche.

Per risolvere questo problema, potrebbe essere necessario eseguire il downsample del set di training o aggiungerlo. Il downsampling può essere eseguito in uno dei due casi:

Sbarazzarsi di una determinata percentuale dei dati di training in modo casuale.
In modo più sistematico analizzando il set di dati e rimuovendo voci duplicate sopra rappresentate.

È anche possibile aggiungere al set di training selezionando Suggerisci espressioni nella scheda Etichettatura dati in Language Studio. Il Language Understanding conversazionale invierà una chiamata ad Azure OpenAI per generare espressioni simili.

È anche consigliabile cercare "pattern" imprevisti nel set di training. Ad esempio, se il set di training per una determinata finalità è tutto minuscolo o inizia con una frase specifica. In questi casi, il modello di cui si esegue il training potrebbe apprendere queste distorsioni impreviste nel set di training invece di essere in grado di generalizzare.

È consigliabile introdurre la diversità di maiuscole e minuscole e punteggiatura nel set di training. Se si prevede che il modello gestisca le variazioni, assicurarsi di avere un set di training che rifletta anche tale diversità. Ad esempio, includere alcune espressioni con maiuscole e minuscole appropriate e alcune in lettere minuscole.

Separazione dei dati

Prima di iniziare il processo di training, le espressioni etichettate nel progetto vengono suddivise in un set di training e in un set di test. Ognuno di essi svolge una funzione diversa. Il set di training viene usato per il training del modello, ovvero il set da cui il modello apprende le espressioni etichettate. Il set di test è un set cieco che non viene introdotto nel modello durante il training, ma solo durante la valutazione.

Dopo aver eseguito correttamente il training del modello, è possibile usare il modello per eseguire stime dalle espressioni nel set di test. Queste stime vengono usate per calcolare le metriche di valutazione. È consigliabile assicurarsi che tutte le finalità e le entità siano adeguatamente rappresentate sia nel set di training che nel set di test.

La comprensione del linguaggio conversazionale supporta due metodi per la suddivisione dei dati:

Suddivisione automatica del set di test dai dati di training: il sistema suddividerà i dati con tag tra i set di training e di test, in base alle percentuali scelte. La divisione percentuale consigliata è l'80% per il training e il 20% per i test.

Nota

Se si sceglie l'opzione Suddivisione automatica del set di test dai dati di training , solo i dati assegnati al set di training verranno suddivisi in base alle percentuali specificate.

Usare una suddivisione manuale dei dati di training e test: questo metodo consente agli utenti di definire quali espressioni devono appartenere a quale set. Questo passaggio è abilitato solo se sono state aggiunte espressioni al set di test durante l'etichettatura.

Modalità di training

CLU supporta due modalità per il training dei modelli

Il training standard usa algoritmi di Machine Learning rapidi per eseguire il training dei modelli relativamente rapidamente. Questa opzione è attualmente disponibile solo per l'inglese ed è disabilitata per qualsiasi progetto che non usa inglese (Stati Uniti) o inglese (Regno Unito) come lingua primaria. Questa opzione di training è gratuita. Il training standard consente di aggiungere espressioni e testarle rapidamente senza costi. I punteggi di valutazione mostrati dovrebbero guidare l'utente su dove apportare modifiche nel progetto e aggiungere altre espressioni. Dopo aver eseguito l'iterazione di alcune volte e aver apportato miglioramenti incrementali, è possibile prendere in considerazione l'uso del training avanzato per eseguire il training di un'altra versione del modello.
Il training avanzato usa la tecnologia più recente di Machine Learning per personalizzare i modelli con i dati. Questo dovrebbe mostrare punteggi di prestazioni migliori per i modelli e consentirà di usare anche le funzionalità multilingue di CLU. La formazione avanzata ha un prezzo diverso. Per informazioni dettagliate, vedere le informazioni sui prezzi .

Usare i punteggi di valutazione per guidare le decisioni. In alcuni casi è possibile che un esempio specifico venga stimato in modo non corretto nel training avanzato anziché quando è stata usata la modalità di training standard. Tuttavia, se i risultati della valutazione complessiva sono migliori usando i risultati avanzati, è consigliabile usare il modello finale. Se questo non è il caso e non si sta cercando di usare funzionalità multilingue, è possibile continuare a usare il modello sottoposto a training con la modalità standard.

Nota

È consigliabile osservare una differenza nei comportamenti nei punteggi di attendibilità delle finalità tra le modalità di training perché ogni algoritmo calibra i punteggi in modo diverso.

Per avviare il training del modello dall'interno di Language Studio:

Selezionare Train model (Esegui training modello ) dal menu a sinistra.
Selezionare Avvia un processo di training dal menu in alto.
Selezionare Esegui training di un nuovo modello e immettere un nuovo nome di modello nella casella di testo. In caso contrario, per sostituire un modello esistente con un modello sottoposto a training sui nuovi dati, selezionare Sovrascrivi un modello esistente e quindi selezionare un modello esistente. La sovrascrittura di un modello sottoposto a training è irreversibile, ma non influisce sui modelli distribuiti fino a quando non si distribuisce il nuovo modello.
Selezionare la modalità di training. È possibile scegliere Formazione standard per una formazione più veloce, ma è disponibile solo per l'inglese. In alternativa, è possibile scegliere Formazione avanzata supportata per altri linguaggi e progetti multilingue, ma comporta tempi di formazione più lunghi. Altre informazioni sulle modalità di training.
Selezionare un metodo di suddivisione dei dati . È possibile scegliere Suddivisione automatica del set di test dai dati di training in cui il sistema dividerà le espressioni tra i set di training e di test, in base alle percentuali specificate. In alternativa, è possibile usare una suddivisione manuale dei dati di training e test, questa opzione è abilitata solo se sono state aggiunte espressioni al set di test quando sono state etichettate le espressioni.
Selezionare il pulsante Train (Esegui training ).
Selezionare l'ID processo di training nell'elenco. Verrà visualizzato un pannello in cui è possibile controllare lo stato del training, lo stato del processo e altri dettagli per questo processo.
Nota
- Solo i processi di training completati correttamente genereranno modelli.
- Il training può richiedere tempo tra un paio di minuti e un paio di ore in base al numero di espressioni.
- È possibile eseguire un solo processo di training alla volta. Non è possibile avviare altri processi di training all'interno dello stesso progetto fino al completamento del processo in esecuzione.
- L'apprendimento automatico usato per eseguire il training dei modelli viene aggiornato regolarmente. Per eseguire il training in una versione di configurazione precedente, selezionare Seleziona qui per passare dalla pagina Avvia un processo di training e scegliere una versione precedente.

Avviare il processo di training

Creare una richiesta POST usando l'URL, le intestazioni e il corpo JSON seguenti per inviare un processo di training.

URL richiesta

Usare l'URL seguente durante la creazione della richiesta API. Sostituire i valori segnaposto con i valori personalizzati.

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/:train?api-version={API-VERSION}

Segnaposto	Valore	Esempio
`{ENDPOINT}`	Endpoint per l'autenticazione della richiesta API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Nome del progetto. Per questo valore viene applicata la distinzione tra maiuscole e minuscole.	`EmailApp`
`{API-VERSION}`	Versione dell'API che si sta chiamando.	`2023-04-01`

Intestazioni

Usare l'intestazione seguente per autenticare la richiesta.

Chiave	Valore
`Ocp-Apim-Subscription-Key`	Chiave della risorsa. Usato per autenticare le richieste API.

Testo della richiesta

Usare l'oggetto seguente nella richiesta. Il modello verrà denominato dopo il valore usato per il parametro al termine del modelLabel training.

{
  "modelLabel": "{MODEL-NAME}",
  "trainingMode": "{TRAINING-MODE}",
  "trainingConfigVersion": "{CONFIG-VERSION}",
  "evaluationOptions": {
    "kind": "percentage",
    "testingSplitPercentage": 20,
    "trainingSplitPercentage": 80
  }
}

Chiave	Segnaposto	Valore	Esempio
`modelLabel`	`{MODEL-NAME}`	Nome del modello.	`Model1`
`trainingConfigVersion`	`{CONFIG-VERSION}`	Versione del modello di configurazione del training. Per impostazione predefinita, viene usata la versione più recente del modello .	`2022-05-01`
`trainingMode`	`{TRAINING-MODE}`	Modalità di training da utilizzare per il training. Le modalità supportate sono formazione standard, formazione più veloce, ma disponibile solo per la formazione inglese e avanzata supportata per altre lingue e progetti multilingue, ma comporta tempi di formazione più lunghi. Altre informazioni sulle modalità di training.	`standard`
`kind`	`percentage`	Metodi di divisione. I valori possibili sono `percentage` o `manual`. Per altre informazioni, vedere come eseguire il training di un modello .	`percentage`
`trainingSplitPercentage`	`80`	Percentuale dei dati con tag da includere nel set di training. Il valore consigliato è `80`.	`80`
`testingSplitPercentage`	`20`	Percentuale dei dati con tag da includere nel set di test. Il valore consigliato è `20`.	`20`

Nota

E trainingSplitPercentagetestingSplitPercentage sono obbligatori solo se Kind è impostato su percentage e la somma di entrambe le percentuali deve essere uguale a 100.

Dopo aver inviato la richiesta API, si riceverà una 202 risposta che indica l'esito positivo. Nelle intestazioni di risposta estrarre il operation-location valore. Verrà formattato come segue:

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}?api-version={API-VERSION}

È possibile usare questo URL per ottenere lo stato del processo di training.

Ottenere lo stato del processo di training

Il training potrebbe richiedere tempo a seconda delle dimensioni dei dati di training e della complessità dello schema. È possibile usare la richiesta seguente per mantenere il polling dello stato del processo di training fino al completamento.

Quando si invia una richiesta di training riuscita, l'URL completo della richiesta per controllare lo stato del processo (incluso l'endpoint, il nome del progetto e l'ID processo) è contenuto nell'intestazione della operation-location risposta.

Usare la richiesta GET seguente per ottenere lo stato dello stato di avanzamento del training del modello. Sostituire i valori segnaposto seguenti con i valori personalizzati.

URL richiesta

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}?api-version={API-VERSION}

Segnaposto	Valore	Esempio
`{YOUR-ENDPOINT}`	Endpoint per l'autenticazione della richiesta API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Nome del progetto. Per questo valore viene applicata la distinzione tra maiuscole e minuscole.	`EmailApp`
`{JOB-ID}`	ID per l'individuazione dello stato di training del modello.	`xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx`
`{API-VERSION}`	Versione dell'API che si sta chiamando.	`2023-04-01`

Intestazioni

Usare l'intestazione seguente per autenticare la richiesta.

Chiave	Valore
`Ocp-Apim-Subscription-Key`	Chiave della risorsa. Usato per autenticare le richieste API.

Corpo della risposta

Dopo aver inviato la richiesta, si riceverà la risposta seguente. Continuare a eseguire il polling di questo endpoint fino a quando il parametro di stato non viene modificato in "succeeded".

{
  "result": {
    "modelLabel": "{MODEL-LABEL}",
    "trainingConfigVersion": "{TRAINING-CONFIG-VERSION}",
    "trainingMode": "{TRAINING-MODE}",
    "estimatedEndDateTime": "2022-04-18T15:47:58.8190649Z",
    "trainingStatus": {
      "percentComplete": 3,
      "startDateTime": "2022-04-18T15:45:06.8190649Z",
      "status": "running"
    },
    "evaluationStatus": {
      "percentComplete": 0,
      "status": "notStarted"
    }
  },
  "jobId": "xxxxx-xxxxx-xxxx-xxxxx-xxxx",
  "createdDateTime": "2022-04-18T15:44:44Z",
  "lastUpdatedDateTime": "2022-04-18T15:45:48Z",
  "expirationDateTime": "2022-04-25T15:44:44Z",
  "status": "running"
}

Chiave	Valore	Esempio
`modelLabel`	Nome del modello	`Model1`
`trainingConfigVersion`	Versione di configurazione del training. Per impostazione predefinita, viene usata la versione più recente .	`2022-05-01`
`trainingMode`	Modalità di training selezionata.	`standard`
`startDateTime`	Ora di inizio del training	`2022-04-14T10:23:04.2598544Z`
`status`	Stato del processo di training	`running`
`estimatedEndDateTime`	Tempo stimato per il completamento del processo di training	`2022-04-14T10:29:38.2598544Z`
`jobId`	ID processo di training	`xxxxx-xxxx-xxxx-xxxx-xxxxxxxxx`
`createdDateTime`	Data e ora di creazione del processo di training	`2022-04-14T10:22:42Z`
`lastUpdatedDateTime`	Data e ora dell'ultimo aggiornamento del processo di training	`2022-04-14T10:23:45Z`
`expirationDateTime`	Data e ora di scadenza del processo di training	`2022-04-14T10:22:42Z`

Annullare il processo di training

Language Studio
API REST

Per annullare un processo di training da Language Studio

Nella pagina Train model (Esegui training modello ) selezionare il processo di training da annullare e selezionare Annulla dal menu in alto.

Creare una richiesta POST usando l'URL, le intestazioni e il corpo JSON seguenti per annullare un processo di training.

URL richiesta

Usare l'URL seguente durante la creazione della richiesta API. Sostituire i valori segnaposto seguenti con i valori personalizzati.

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}/:cancel?api-version={API-VERSION}

Segnaposto	Valore	Esempio
`{ENDPOINT}`	Endpoint per l'autenticazione della richiesta API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Nome del progetto. Per questo valore viene applicata la distinzione tra maiuscole e minuscole.	`EmailApp`
`{JOB-ID}`	Questo è l'ID del processo di training.	`XXXXX-XXXXX-XXXX-XX`
`{API-VERSION}`	Versione dell'API che si sta chiamando.	`2023-04-01`

Intestazioni

Usare l'intestazione seguente per autenticare la richiesta.

Chiave	Valore
`Ocp-Apim-Subscription-Key`	Chiave della risorsa. Usato per autenticare le richieste API.

Dopo aver inviato la richiesta API, si riceverà una risposta 202 che indica l'esito positivo, il che significa che il processo di training è stato annullato. Risultati di una chiamata con esito positivo con un'intestazione Operation-Location usata per controllare lo stato del processo.

Passaggi successivi

Metriche di valutazione dei modelli

Eseguire il training del modello di comprensione del linguaggio conversazionale

Prerequisiti

Bilanciare i dati di training

Separazione dei dati

Modalità di training

Eseguire il training del modello

Annullare il processo di training

Passaggi successivi

Risorse aggiuntive