Eseguire il training del modello del flusso di lavoro di orchestrazione

Articolo
12/19/2023

Il training è il processo in cui il modello apprende dalle espressioni etichettate. Al termine del training, sarà possibile visualizzare le prestazioni del modello.

Per eseguire il training di un modello, avviare un processo di training. Solo i processi completati creano un modello. I processi di training scadono dopo sette giorni, dopo questa volta non sarà più possibile recuperare i dettagli del processo. Se il processo di training è stato completato correttamente e un modello è stato creato, non sarà interessato dalla scadenza del processo. È possibile avere un solo processo di training in esecuzione alla volta e non è possibile avviare altri processi nello stesso progetto.

I tempi di training possono essere ovunque da pochi secondi quando si gestiscono progetti semplici, fino a un paio di ore quando si raggiunge il limite massimo di espressioni.

La valutazione del modello viene attivata automaticamente dopo il completamento del training. Il processo di valutazione inizia usando il modello sottoposto a training per eseguire stime sulle espressioni nel set di test e confronta i risultati stimati con le etichette fornite (che stabilisce una baseline di verità). I risultati vengono restituiti in modo da poter esaminare le prestazioni del modello.

Prerequisiti

Un progetto creato correttamente con un account di archiviazione BLOB di Azure configurato

Per altre informazioni, vedere il ciclo di vita dello sviluppo del progetto .

Separazione dei dati

Prima di iniziare il processo di training, le espressioni etichettate nel progetto vengono suddivise in un set di training e in un set di test. Ognuno di essi svolge una funzione diversa. Il set di training viene usato per il training del modello, ovvero il set da cui il modello apprende le espressioni etichettate. Il set di test è un set cieco che non viene introdotto nel modello durante il training, ma solo durante la valutazione.

Dopo aver eseguito correttamente il training del modello, è possibile usare il modello per eseguire stime dalle espressioni nel set di test. Queste stime vengono usate per calcolare le metriche di valutazione.

È consigliabile assicurarsi che tutte le finalità siano adeguatamente rappresentate sia nel set di training che nel set di test.

Il flusso di lavoro di orchestrazione supporta due metodi per la suddivisione dei dati:

Suddivisione automatica del set di test dai dati di training: il sistema suddividerà i dati con tag tra i set di training e di test, in base alle percentuali scelte. La divisione percentuale consigliata è l'80% per il training e il 20% per i test.

Nota

Se si sceglie l'opzione Suddivisione automatica del set di test dai dati di training , solo i dati assegnati al set di training verranno suddivisi in base alle percentuali specificate.

Usare una suddivisione manuale dei dati di training e test: questo metodo consente agli utenti di definire quali espressioni devono appartenere a quale set. Questo passaggio è abilitato solo se sono state aggiunte espressioni al set di test durante l'etichettatura.

Nota

È possibile aggiungere espressioni solo nel set di dati di training solo per finalità non connesse.

Eseguire il training del modello

Per avviare il training del modello dall'interno di Language Studio:

Selezionare Processi di training dal menu a sinistra.
Selezionare Avvia un processo di training dal menu in alto.
Selezionare Esegui training di un nuovo modello e digitare il nome del modello nella casella di testo. È anche possibile sovrascrivere un modello esistente selezionando questa opzione e scegliendo il modello da sovrascrivere dal menu a discesa. La sovrascrittura di un modello sottoposto a training è irreversibile, ma non influisce sui modelli distribuiti fino a quando non si distribuisce il nuovo modello.

Se il progetto è stato abilitato per suddividere manualmente i dati quando si contrassegnano le espressioni, verranno visualizzate due opzioni di suddivisione dei dati:
- Suddivisione automatica del set di test dai dati di training: le espressioni con tag verranno suddivise in modo casuale tra i set di training e di test, in base alle percentuali scelte. La divisione percentuale predefinita è l'80% per il training e il 20% per i test. Per modificare questi valori, scegliere il set da modificare e digitare nel nuovo valore.
Nota

Se si sceglie l'opzione Suddivisione automatica del set di test dai dati di training , solo le espressioni nel set di training verranno suddivise in base alle percentuali specificate.
- Usare una suddivisione manuale dei dati di training e test: assegnare ogni espressione al training o al set di test durante il passaggio di assegnazione di tag del progetto.
Nota

Usare una suddivisione manuale dei dati di training e test verrà abilitata solo se si aggiungono espressioni al set di test nella pagina dei dati dei tag. In caso contrario, verrà disabilitato.
Selezionare il pulsante Train (Esegui training ).

Nota

Solo i processi di training completati correttamente genereranno modelli.
Il training può richiedere tempo tra un paio di minuti e un paio di ore in base alle dimensioni dei dati con tag.
È possibile eseguire un solo processo di training alla volta. Non è possibile avviare altri processi di training con lo stesso progetto fino al completamento del processo in esecuzione.

Creare una richiesta POST usando l'URL, le intestazioni e il corpo JSON seguenti per inviare un processo di training.

URL richiesta

Usare l'URL seguente durante la creazione della richiesta API. Sostituire i valori segnaposto seguenti con i valori personalizzati.

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/:train?api-version={API-VERSION}

Segnaposto	Valore	Esempio
`{ENDPOINT}`	Endpoint per l'autenticazione della richiesta API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Nome del progetto. Per questo valore viene applicata la distinzione tra maiuscole e minuscole.	`EmailApp`
`{API-VERSION}`	Versione dell'API che si sta chiamando.	`2023-04-01`

Intestazioni

Usare l'intestazione seguente per autenticare la richiesta.

Chiave	Valore
`Ocp-Apim-Subscription-Key`	Chiave della risorsa. Usato per autenticare le richieste API.

Testo della richiesta

Usare l'oggetto seguente nella richiesta. Il modello verrà denominato MyModel al termine del training.

{
  "modelLabel": "{MODEL-NAME}",
  "trainingMode": "standard",
  "trainingConfigVersion": "{CONFIG-VERSION}",
  "evaluationOptions": {
    "kind": "percentage",
    "testingSplitPercentage": 20,
    "trainingSplitPercentage": 80
  }
}

Chiave	Segnaposto	Valore	Esempio
`modelLabel`	`{MODEL-NAME}`	Nome del modello.	`Model1`
`trainingMode`	`standard`	Modalità di training. Nell'orchestrazione è disponibile una sola modalità per il training, ovvero `standard`.	`standard`
`trainingConfigVersion`	`{CONFIG-VERSION}`	Versione del modello di configurazione del training. Per impostazione predefinita, viene usata la versione più recente del modello .	`2022-05-01`
`kind`	`percentage`	Metodi di divisione. I possibili valori sono `percentage` o `manual`. Per altre informazioni, vedere come eseguire il training di un modello .	`percentage`
`trainingSplitPercentage`	`80`	Percentuale dei dati con tag da includere nel set di training. Il valore consigliato è `80`.	`80`
`testingSplitPercentage`	`20`	Percentuale dei dati con tag da includere nel set di test. Il valore consigliato è `20`.	`20`

Nota

E trainingSplitPercentagetestingSplitPercentage sono obbligatori solo se Kind è impostato su percentage e la somma di entrambe le percentuali deve essere uguale a 100.

Dopo aver inviato la richiesta API, si riceverà una 202 risposta che indica l'esito positivo. Nelle intestazioni di risposta estrarre il operation-location valore. Verrà formattato come segue:

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}?api-version={API-VERSION}

È possibile usare questo URL per ottenere lo stato del processo di training.

Ottenere lo stato del processo di training

Language Studio
API REST

Selezionare l'ID processo di training nell'elenco, verrà visualizzato un riquadro laterale in cui è possibile controllare lo stato del training, lo stato del processo e altri dettagli per questo processo.

Il training potrebbe richiedere tempo a seconda delle dimensioni dei dati di training e della complessità dello schema. È possibile usare la richiesta seguente per mantenere il polling dello stato del processo di training fino al completamento.

Usare la richiesta GET seguente per ottenere lo stato dello stato di avanzamento del training del modello. Sostituire i valori segnaposto seguenti con i valori personalizzati.

URL richiesta

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}?api-version={API-VERSION}

Segnaposto	Valore	Esempio
`{YOUR-ENDPOINT}`	Endpoint per l'autenticazione della richiesta API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Nome del progetto. Per questo valore viene applicata la distinzione tra maiuscole e minuscole.	`EmailApp`
`{JOB-ID}`	ID per l'individuazione dello stato di training del modello. Si tratta del valore di `location` intestazione ricevuto quando è stato inviato il processo di training.	`xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx`
`{API-VERSION}`	Versione dell'API che si sta chiamando.	`2023-04-01`

Intestazioni

Usare l'intestazione seguente per autenticare la richiesta.

Chiave	Valore
`Ocp-Apim-Subscription-Key`	Chiave della risorsa. Usato per autenticare le richieste API.

Corpo della risposta

Dopo aver inviato la richiesta, si riceverà la risposta seguente. Continuare a eseguire il polling di questo endpoint fino a quando il parametro di stato non viene modificato in "succeeded".

{
  "result": {
    "modelLabel": "{MODEL-LABEL}",
    "trainingConfigVersion": "{TRAINING-CONFIG-VERSION}",
    "estimatedEndDateTime": "2022-04-18T15:47:58.8190649Z",
    "trainingStatus": {
      "percentComplete": 3,
      "startDateTime": "2022-04-18T15:45:06.8190649Z",
      "status": "running"
    },
    "evaluationStatus": {
      "percentComplete": 0,
      "status": "notStarted"
    }
  },
  "jobId": "xxxxxx-xxxxx-xxxxxx-xxxxxx",
  "createdDateTime": "2022-04-18T15:44:44Z",
  "lastUpdatedDateTime": "2022-04-18T15:45:48Z",
  "expirationDateTime": "2022-04-25T15:44:44Z",
  "status": "running"
}

Chiave	Valore	Esempio
`modelLabel`	Nome del modello	`Model1`
`trainingConfigVersion`	Versione di configurazione del training. Per impostazione predefinita, viene usata la versione più recente .	`2022-05-01`
`startDateTime`	Ora di inizio del training	`2022-04-14T10:23:04.2598544Z`
`status`	Stato del processo di training	`running`
`estimatedEndDateTime`	Tempo stimato per il completamento del processo di training	`2022-04-14T10:29:38.2598544Z`
`jobId`	ID processo di training	`xxxxx-xxxx-xxxx-xxxx-xxxxxxxxx`
`createdDateTime`	Data e ora di creazione del processo di training	`2022-04-14T10:22:42Z`
`lastUpdatedDateTime`	Data e ora dell'ultimo aggiornamento del processo di training	`2022-04-14T10:23:45Z`
`expirationDateTime`	Data e ora di scadenza del processo di training	`2022-04-14T10:22:42Z`

Annullare il processo di training

Language Studio
API REST

Per annullare un processo di training da Language Studio, passare alla pagina Train model (Esegui training modello ). Selezionare il processo di training da annullare e selezionare Annulla dal menu in alto.

Creare una richiesta POST usando l'URL, le intestazioni e il corpo JSON seguenti per annullare un processo di training.

URL richiesta

Usare l'URL seguente durante la creazione della richiesta API. Sostituire i valori segnaposto seguenti con i valori personalizzati.

{ENDPOINT}/language/authoring/analyze-conversations/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}/:cancel?api-version={API-VERSION}

Segnaposto	Valore	Esempio
`{ENDPOINT}`	Endpoint per l'autenticazione della richiesta API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Nome del progetto. Per questo valore viene applicata la distinzione tra maiuscole e minuscole.	`EmailApp`
`{JOB-ID}`	Questo è l'ID del processo di training	`XXXXX-XXXXX-XXXX-XX`
`{API-VERSION}`	Versione dell'API che si sta chiamando.	`2023-04-01`

Intestazioni

Usare l'intestazione seguente per autenticare la richiesta.

Chiave	Valore
`Ocp-Apim-Subscription-Key`	Chiave della risorsa. Usato per autenticare le richieste API.

Dopo aver inviato la richiesta API, si riceverà una risposta 202 che indica l'esito positivo, il che significa che il processo di training è stato annullato. Risultati di una chiamata con esito positivo con un'intestazione Operation-Location utilizzata per controllare lo stato del processo.

Condividi tramite

Eseguire il training del modello del flusso di lavoro di orchestrazione

Prerequisiti

Separazione dei dati

Eseguire il training del modello

Avviare il processo di training

URL richiesta

Intestazioni

Testo della richiesta

Ottenere lo stato del processo di training

URL richiesta

Intestazioni

Corpo della risposta

Annullare il processo di training

URL richiesta

Intestazioni

Passaggi successivi

Commenti e suggerimenti

Commenti e suggerimenti

Risorse aggiuntive