Condividi tramite


Ciclo di vita del modello conversione voce/testo personalizzato

È possibile usare un modello di Riconoscimento vocale personalizzato per un certo periodo di tempo dopo la distribuzione nell'endpoint personalizzato. Tuttavia, quando vengono resi disponibili nuovi modelli di base, i modelli meno recenti scadono. È necessario ricreare ed eseguire periodicamente il training del modello personalizzato dall'ultimo modello di base per sfruttare i miglioramenti dell'accuratezza e della qualità.

Ecco alcuni termini chiave correlati al ciclo di vita del modello:

  • Training: partire da un modello di base e personalizzarlo per il dominio o lo scenario usando dati di testo e/o dati audio. In alcuni contesti, ad esempio le proprietà dell'API REST, il training viene definito anche adattamento.
  • Trascrizione: usare un modello ed eseguire il riconoscimento vocale (decodifica dell'audio in testo).
  • Endpoint: distribuzione specifica di un modello di base o di un modello personalizzato accessibile solo dall'utente.

Nota

Gli endpoint usati dalle risorse Voce F0 vengono eliminati dopo sette giorni.

Tempi di scadenza

Ecco i tempi di scadenza per la trascrizione e l'adattamento del modello:

  • Il training è disponibile per un anno dopo il trimestre in cui Microsoft ha creato il modello di base.
  • La trascrizione con un modello di base è disponibile per due anni dopo il trimestre in cui Microsoft ha creato il modello di base.
  • La trascrizione per un modello personalizzato è disponibile per due anni dopo il trimestre in cui si è creato il modello personalizzato.

In questo contesto, i trimestri terminano il 15 gennaio, il 15 aprile, il 15 luglio e il 15 ottobre.

Cosa fare alla scadenza di un modello

Quando un modello personalizzato o un modello di base scade, non è più disponibile per la trascrizione. È possibile modificare il modello usato dall'endpoint personalizzato per il riconoscimento vocale senza tempi di inattività.

Route di trascrizione Risultato del modello scaduto Elemento consigliato
Endpoint personalizzato Le richieste di riconoscimento vocale eseguono il fallback al modello di base più recente per le stesse impostazioni locali. Si ottengono risultati, ma il riconoscimento potrebbe non trascrivere in modo accurato i dati del dominio. Aggiornare il modello dell'endpoint come descritto nella guida Distribuire un modello di Riconoscimento vocale personalizzato.
Trascrizione batch Le richieste di trascrizione Batch per i modelli scaduti avranno esito negativo con un errore 4xx. Nel corpo della richiesta di ogni API REST Transcriptions_Create impostare la proprietà model su un modello di base o un modello personalizzato non ancora scaduto. In caso contrario, non includere la proprietà model per usare sempre il modello di base più recente.

Ottenere le date di scadenza del modello di base

L'ultima data in cui è possibile usare il modello di base per il training è stata visualizzata al momento della creazione del modello personalizzato. Per altre informazioni, vedere Eseguire il training di un modello di Riconoscimento vocale personalizzato.

Seguire queste istruzioni per ottenere la data di scadenza della trascrizione per un modello di base:

  1. Accedere a Speech Studio.

  2. Selezionare Riconoscimento vocale personalizzato> Nome progetto >Distribuire modelli.

  3. La data di scadenza per il modello viene visualizzata nella colonna Scadenza. Questa è l'ultima data in cui è possibile usare il modello per la trascrizione.

    Screenshot della pagina Distribuisci modelli che mostra la data di scadenza della trascrizione.

Per ottenere le date di scadenza del training e della trascrizione per un modello di base, usare il comando spx csr model status. Costruire i parametri della richiesta in base alle istruzioni seguenti:

  • Impostare il parametro url sull'URI del modello di base da recuperare. È possibile eseguire il comando spx csr list --base per ottenere i modelli di base disponibili per tutte le impostazioni locali.

Ecco un esempio di comando dell'interfaccia della riga di comando di Voce per ottenere le date di scadenza del training e della trascrizione per un modello di base:

spx csr model status --api-version v3.1 --model https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/b0bbc1e0-78d5-468b-9b7c-a5a43b2bb83f

Nella risposta prendere nota della data nella proprietà adaptationDateTime. Questa proprietà è l'ultima data in cui è possibile usare il modello di base per il training. Prendere nota anche della data nella proprietà transcriptionDateTime. Questa è l'ultima data in cui è possibile usare il modello di base per la trascrizione.

Dovrebbe essere visualizzato un corpo della risposta nel formato seguente:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
  "datasets": [],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-01-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-06T10:52:02Z",
  "status": "Succeeded",
  "createdDateTime": "2021-10-13T00:00:00Z",
  "locale": "en-US",
  "displayName": "20210831 + Audio file adaptation",
  "description": "en-US base model"
}

Per visualizzare le informazioni della guida dell'interfaccia della riga di comando di Voce per i modelli, eseguire il comando seguente:

spx help csr model

Per ottenere le date di scadenza del training e della trascrizione per un modello di base, usare l'operazione Models_GetBaseModel dell'API REST Riconoscimento vocale. È possibile effettuare una richiesta Models_ListBaseModels per ottenere i modelli di base disponibili per tutte le impostazioni locali.

Effettuare una richiesta HTTP GET usando l'URI del modello come illustrato nell'esempio seguente. Sostituire BaseModelId con l'ID del modello, sostituire YourSubscriptionKey con la chiave della risorsa Voce e sostituire YourServiceRegion con l'area della risorsa Voce.

curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/BaseModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

Nella risposta prendere nota della data nella proprietà adaptationDateTime. Questa è l'ultima data in cui è possibile usare il modello di base per il training. Prendere nota anche della data nella proprietà transcriptionDateTime. Questa è l'ultima data in cui è possibile usare il modello di base per la trascrizione.

Si dovrebbe ricevere un corpo della risposta nel formato seguente:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
  "datasets": [],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-01-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-06T10:52:02Z",
  "status": "Succeeded",
  "createdDateTime": "2021-10-13T00:00:00Z",
  "locale": "en-US",
  "displayName": "20210831 + Audio file adaptation",
  "description": "en-US base model"
}

Ottenere le date di scadenza del modello personalizzato

Seguire queste istruzioni per ottenere la data di scadenza della trascrizione per un modello personalizzato:

  1. Accedere a Speech Studio.

  2. Selezionare Riconoscimento vocale personalizzato> Nome del progetto >Esegui il training dei modelli personalizzati.

  3. La data di scadenza per il modello personalizzato viene visualizzata nella colonna Scadenza. Questa è l'ultima data in cui è possibile usare il modello personalizzato per la trascrizione. I modelli di base non vengono visualizzati nella pagina Eseguire il training di modelli personalizzati.

    Screenshot della pagina Esegui il training di modelli personalizzati che mostra la data di scadenza della trascrizione.

È anche possibile seguire queste istruzioni per ottenere la data di scadenza della trascrizione per un modello personalizzato:

  1. Accedere a Speech Studio.

  2. Selezionare Riconoscimento vocale personalizzato> Nome progetto >Distribuire modelli.

  3. La data di scadenza per il modello viene visualizzata nella colonna Scadenza. Questa è l'ultima data in cui è possibile usare il modello per la trascrizione.

    Screenshot della pagina Distribuisci modelli che mostra la data di scadenza della trascrizione.

Per ottenere la data di scadenza della trascrizione per il modello personalizzato, usare il comando spx csr model status. Costruire i parametri della richiesta in base alle istruzioni seguenti:

  • Impostare il parametro url sull'URI del modello da recuperare. Sostituire YourModelId con l'ID del modello e YourServiceRegion con l'area della risorsa Voce.

Ecco un esempio di comando dell'interfaccia della riga di comando di Voce per ottenere la data di scadenza della trascrizione per il modello personalizzato:

spx csr model status --api-version v3.1 --model https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/YourModelId

Nella risposta prendere nota della data nella proprietà transcriptionDateTime. Questa è l'ultima data in cui è possibile usare il modello personalizzato per la trascrizione. La proprietà adaptationDateTime non è applicabile, poiché i modelli personalizzati non vengono usati per eseguire il training di altri modelli personalizzati.

Dovrebbe essere visualizzato un corpo della risposta nel formato seguente:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
  "baseModel": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
  },
  "datasets": [
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
    }
  ],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
    "copyTo": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-07-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-21T13:21:01Z",
  "status": "Succeeded",
  "createdDateTime": "2022-05-22T16:37:01Z",
  "locale": "en-US",
  "displayName": "My Model",
  "description": "My Model Description"
}

Per visualizzare le informazioni della guida dell'interfaccia della riga di comando di Voce per i modelli, eseguire il comando seguente:

spx help csr model

Per ottenere la data di scadenza della trascrizione per il modello personalizzato, usare l'operazione Models_GetCustomModel dell'API REST Riconoscimento vocale.

Effettuare una richiesta HTTP GET usando l'URI del modello come illustrato nell'esempio seguente. Sostituire YourModelId con l'ID del modello, sostituire YourSubscriptionKey con la chiave della risorsa Voce e sostituire YourServiceRegion con l'area della risorsa Voce.

curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/YourModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

Nella risposta prendere nota della data nella proprietà transcriptionDateTime. Questa è l'ultima data in cui è possibile usare il modello personalizzato per la trascrizione. La proprietà adaptationDateTime non è applicabile, poiché i modelli personalizzati non vengono usati per eseguire il training di altri modelli personalizzati.

Dovrebbe essere visualizzato un corpo della risposta nel formato seguente:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
  "baseModel": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
  },
  "datasets": [
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
    }
  ],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
    "copyTo": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-07-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-21T13:21:01Z",
  "status": "Succeeded",
  "createdDateTime": "2022-05-22T16:37:01Z",
  "locale": "en-US",
  "displayName": "My Model",
  "description": "My Model Description"
}