Comparteix a través de


Ciclo de vida del modelo de voz personalizada

Puede usar un modelo de voz personalizada durante algún tiempo después de implementarlo en el punto de conexión personalizado. Pero cuando hay nuevos modelos base disponibles, los anteriores expiran. Debe volver a crear y entrenar periódicamente el modelo personalizado a partir del modelo base más reciente para aprovechar las ventajas de la precisión y la calidad mejoradas.

Estos son algunos términos clave relacionados con el ciclo de vida del modelo:

  • Entrenamiento: tomar un modelo base y personalizarlo para el dominio o escenario propios mediante datos de texto o datos de audio. En algunos contextos, como las propiedades de la API de REST, el entrenamiento también se conoce como adaptación.
  • Transcripción: usar un modelo y realizar el reconocimiento de voz (descodificar audio en texto).
  • Punto de conexión: una implementación específica de un modelo base o un modelo personalizado al que solo se puede acceder.

Nota

Los puntos de conexión usados por los recursos de Voz F0 se eliminan después de siete días.

Escala de tiempo de expiración

Estas son las escalas de tiempo para la adaptación de modelos y la expiración de la transcripción:

  • El entrenamiento está disponible durante un año después del trimestre en que Microsoft haya creado el modelo base.
  • La transcripción con un modelo base está disponible durante dos años después del trimestre en que Microsoft haya creado el modelo base.
  • La transcripción con un modelo personalizado está disponible durante dos años después del trimestre en que se creó el modelo personalizado.

En este contexto, los trimestres terminan el 15 de enero, el 15 de abril, el 15 de julio y el 15 de octubre.

Qué hacer cuando un modelo expira

Cuando un modelo personalizado o un modelo base expiren, ya no estarán disponibles para la transcripción. Puede cambiar el modelo que usa el punto de conexión de Habla personalizada sin tiempo de inactividad.

Ruta de transcripción Resultado del modelo expirado Recomendación
Punto de conexión personalizado Las solicitudes de reconocimiento de voz se revertirán al modelo base más reciente para la misma configuración regional. Obtendrá resultados, pero es posible que el reconocimiento no transcriba con precisión los datos del dominio. Actualice el modelo del punto de conexión como se describe en la guía Implementación de un modelo de voz personalizada.
Transcripción de Azure Batch Las solicitudes de transcripción por lotes para los modelos expirados generan un error 4xx. En cada cuerpo de la solicitud de la API de REST Transcriptions_Create, establezca la propiedad model en un modelo base o en un modelo personalizado que aún no haya expirado. De lo contrario, no incluya la propiedad model para usar siempre el modelo base más reciente.

Obtención de fechas de expiración de modelo base

La última fecha en que podría usar el modelo base para el entrenamiento se ha mostrado al crear el modelo personalizado. Para más información, vea Entrenamiento de un modelo de voz personalizada.

Siga estas instrucciones para obtener la fecha de expiración de la transcripción para un modelo base:

  1. Inicie sesión en Speech Studio.

  2. Seleccione Voz personalizada> El nombre del proyecto >Implementación de modelos.

  3. La fecha de expiración del modelo se muestra en la columna Expiración. Esta es la fecha más reciente en la que puede usar el modelo para la transcripción.

    Captura de pantalla de la página de los modelos de implementación en la que se muestra la fecha de expiración de la transcripción.

Para obtener las fechas de expiración de entrenamiento y transcripción de un modelo base, use el comando spx csr model status. Construya los parámetros de solicitud según las instrucciones siguientes:

  • Establezca el parámetro url en el URI del modelo base que quiera obtener. Puede ejecutar el comando spx csr list --base a fin de obtener los modelos base disponibles para todas las configuraciones regionales.

Este es un comando de ejemplo de la CLI de Voz para obtener las fechas de expiración de entrenamiento y transcripción de un modelo base:

spx csr model status --api-version v3.1 --model https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/b0bbc1e0-78d5-468b-9b7c-a5a43b2bb83f

En la respuesta, anote la fecha en la propiedad adaptationDateTime. Esta propiedad es la fecha más reciente en la que puede usar el modelo base para el entrenamiento. Anote también la fecha en la propiedad transcriptionDateTime. Esta es la fecha más reciente en la que puede usar el modelo base para la transcripción.

Debe recibir un cuerpo de respuesta en el formato siguiente:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
  "datasets": [],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-01-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-06T10:52:02Z",
  "status": "Succeeded",
  "createdDateTime": "2021-10-13T00:00:00Z",
  "locale": "en-US",
  "displayName": "20210831 + Audio file adaptation",
  "description": "en-US base model"
}

Para obtener ayuda de la CLI de Voz con modelos, ejecute el comando siguiente:

spx help csr model

Para obtener las fechas de expiración de entrenamiento y transcripción de un modelo base, use la operación Models_GetBaseModel de la API de REST de conversión de voz en texto. Puede realizar una solicitud Models_ListBaseModels a fin de obtener los modelos base disponibles para todas las configuraciones regionales.

Realice una solicitud HTTP GET con el URI del modelo, como se muestra en el ejemplo siguiente. Reemplace BaseModelId por el id. del modelo, YourSubscriptionKey por la clave del recurso de Voz y YourServiceRegion por la región del recurso de Voz.

curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/BaseModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

En la respuesta, anote la fecha en la propiedad adaptationDateTime. Esta es la fecha más reciente en la que puede usar el modelo base para el entrenamiento. Anote también la fecha en la propiedad transcriptionDateTime. Esta es la fecha más reciente en la que puede usar el modelo base para la transcripción.

Debe recibir un cuerpo de respuesta en el formato siguiente:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d",
  "datasets": [],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d/manifest"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-01-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-06T10:52:02Z",
  "status": "Succeeded",
  "createdDateTime": "2021-10-13T00:00:00Z",
  "locale": "en-US",
  "displayName": "20210831 + Audio file adaptation",
  "description": "en-US base model"
}

Obtención de fechas de expiración del modelo personalizado

Siga estas instrucciones para obtener la fecha de expiración de la transcripción para un modelo personalizado:

  1. Inicie sesión en Speech Studio.

  2. Seleccione voz personalizada> El nombre del proyecto >Entrenar modelos personalizados.

  3. La fecha de expiración del modelo personalizado se muestra en la columna Expiración. Esta es la última fecha en la que puede usar el modelo personalizado para la transcripción. Los modelos base no se muestran en la página Entrenar modelos personalizados.

    Captura de pantalla de la página de los modelos personalizados de entrenamientos en la que se muestra la fecha de expiración de la transcripción.

También puede seguir estas instrucciones para obtener la fecha de expiración de la transcripción para un modelo personalizado:

  1. Inicie sesión en Speech Studio.

  2. Seleccione Voz personalizada> El nombre del proyecto >Implementación de modelos.

  3. La fecha de expiración del modelo se muestra en la columna Expiración. Esta es la fecha más reciente en la que puede usar el modelo para la transcripción.

    Captura de pantalla de la página de los modelos de implementación en la que se muestra la fecha de expiración de la transcripción.

Para obtener la fecha de expiración de transcripción del modelo personalizado, use el comando spx csr model status. Construya los parámetros de solicitud según las instrucciones siguientes:

  • Establezca el parámetro url en el URI del modelo que quiera obtener. Reemplace YourModelId por el id. del modelo y YourServiceRegion por la región del recurso de Voz.

Este es un comando de la CLI de Voz de ejemplo para obtener la fecha de expiración de la transcripción para el modelo personalizado:

spx csr model status --api-version v3.1 --model https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/YourModelId

En la respuesta, anote la fecha en la propiedad transcriptionDateTime. Esta es la última fecha en que puede usar el modelo personalizado para la transcripción. La propiedad adaptationDateTime no es aplicable, ya que los modelos personalizados no se usan para entrenar otros modelos personalizados.

Debe recibir un cuerpo de respuesta en el formato siguiente:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
  "baseModel": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
  },
  "datasets": [
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
    }
  ],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
    "copyTo": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-07-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-21T13:21:01Z",
  "status": "Succeeded",
  "createdDateTime": "2022-05-22T16:37:01Z",
  "locale": "en-US",
  "displayName": "My Model",
  "description": "My Model Description"
}

Para obtener ayuda de la CLI de Voz con modelos, ejecute el comando siguiente:

spx help csr model

Para obtener la fecha de expiración de la transcripción para el modelo personalizado, use la operación Models_GetCustomModel de la API de REST de conversión de voz en texto.

Realice una solicitud HTTP GET con el URI del modelo, como se muestra en el ejemplo siguiente. Reemplace YourModelId por el id. del modelo, YourSubscriptionKey por la clave del recurso de Voz y YourServiceRegion por la región del recurso de Voz.

curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/models/YourModelId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

En la respuesta, anote la fecha en la propiedad transcriptionDateTime. Esta es la última fecha en que puede usar el modelo personalizado para la transcripción. La propiedad adaptationDateTime no es aplicable, ya que los modelos personalizados no se usan para entrenar otros modelos personalizados.

Debe recibir un cuerpo de respuesta en el formato siguiente:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7",
  "baseModel": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/1aae1070-7972-47e9-a977-87e3b05c457d"
  },
  "datasets": [
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/69e46263-ab10-4ab4-abbe-62e370104d95"
    }
  ],
  "links": {
    "manifest": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7/manifest",
    "copyTo": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/86c4ebd7-d70d-4f67-9ccc-84609504ffc7:copyto"
  },
  "project": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/projects/5d25e60a-7f4a-4816-afd9-783bb8daccfc"
  },
  "properties": {
    "deprecationDates": {
      "adaptationDateTime": "2023-01-15T00:00:00Z",
      "transcriptionDateTime": "2024-07-15T00:00:00Z"
    }
  },
  "lastActionDateTime": "2022-05-21T13:21:01Z",
  "status": "Succeeded",
  "createdDateTime": "2022-05-22T16:37:01Z",
  "locale": "en-US",
  "displayName": "My Model",
  "description": "My Model Description"
}