Compartir a través de


Personalización de un modelo de lenguaje con Video Indexer de Azure AI

Video Indexer de Azure AI admite el reconocimiento automático de voz mediante la integración con Microsoft Custom Speech Service. Puede personalizar el modelo de lenguaje cargando texto de adaptación. Este texto procede del dominio cuyo vocabulario desea que use el motor para adaptarse. Una vez entrenado el modelo, se reconocen nuevas palabras que aparecen en el texto de adaptación, suponiendo que la pronunciación predeterminada y el modelo de lenguaje aprende nuevas secuencias probables de palabras. Consulte la lista de idiomas compatibles con Video Indexer de Azure AI en langues compatibles.

Por ejemplo, "Kubernetes" (en el contexto de Azure Kubernetes service), es una palabra muy específica. Dado que la palabra es nueva en Video Indexer de Azure AI, se reconoce como "comunidades". Entrene el modelo para reconocerlo como "Kubernetes". En otros casos, existen las palabras, pero el modelo de lenguaje no espera que aparezcan en un contexto determinado. Por ejemplo, "container service" no es una secuencia de 2 palabras que un modelo de lenguaje no especificado reconocería como un conjunto específico de palabras.

Hay dos maneras de personalizar un modelo de lenguaje:

  • Opción 1: Edite la transcripción generada por Video Indexer de Azure AI. Al editar y corregir la transcripción, va a entrenar un modelo de lenguaje para proporcionar resultados mejorados en el futuro.
  • Opción 2: Cargar archivos de texto para entrenar el modelo de lenguaje. El archivo puede contener una lista de palabras como le gustaría que aparezcan en la transcripción de Video Indexer o las palabras pertinentes incluidas naturalmente en oraciones y párrafos. A medida que se obtienen mejores resultados con el último enfoque, se recomienda que el archivo de carga contenga oraciones completas o párrafos relacionados con el contenido.

Importante

No incluya las palabras o oraciones como se ha transcrito actualmente incorrectamente (por ejemplo, "comunidades") en el archivo de carga, ya que esto negará el impacto previsto. Incluya solo las palabras como desea que aparezcan (por ejemplo, "Kubernetes").

Optimización del modelo de lenguaje personalizado

Video Indexer de Azure AI aprende en función de las probabilidades de combinaciones de palabras, por lo que aprenderá mejor:

  • Ofrézcale suficientes ejemplos de oraciones reales del modo en que se pronunciarían.
  • Coloque solo una oración por línea, no más. De lo contrario, el sistema aprenderá probabilidades con las oraciones.
  • Está bien poner una palabra como frase para aumentar la palabra contra otros, pero el sistema aprende mejor de las oraciones completas.
  • Al introducir palabras o acrónimos nuevos, si es posible, proporcione tantos ejemplos de uso como pueda en una oración completa para ofrecer al sistema tanto contexto como sea posible.
  • Intente colocar varias opciones de adaptación y vea cómo funcionan.
  • Evite la repetición de la misma oración exacta varias veces. Puede crear un sesgo en el resto de la entrada.
  • Evite incluir símbolos poco comunes (~, # @ % &) ya que se descartarán. Las oraciones en que las que aparezcan también se descartarán.
  • Evite colocar entradas demasiado grandes, como cientos de miles de oraciones, porque, al hacerlo, reducirá el efecto de impulso.

Requisitos previos

  • Una cuenta de Azure
  • Una cuenta de Video Indexer de Azure AI

Creación de un modelo de lenguaje

  1. Vaya al sitio web de Azure AI Video Indexer e inicie sesión.
  2. Para personalizar un modelo en su cuenta, seleccione el botón Content model customization (Personalización del modelo de contenido) a la izquierda de la página.
  3. Seleccione la pestaña Idioma . Verá una lista de idiomas admitidos.
  4. En el idioma que desee, seleccione Agregar modelo.
  5. Escriba el nombre del modelo de lenguaje y presione Entrar. En este paso se crea el modelo y se ofrece la opción de cargar en él archivos de texto.
  6. Para agregar un archivo de texto, seleccione Agregar archivo. Se abrirá el explorador de archivos.
  7. Vaya al archivo de texto y selecciónelo. Puede agregar varios archivos de texto a un modelo de lenguaje. También puede agregar un archivo de texto seleccionando el botón ... situado en el lado derecho del modelo de lenguaje y seleccionando Agregar archivo.
  8. Cuando termine de cargar los archivos de texto, seleccione la opción verde Entrenar.

Este proceso puede tardar varios minutos. Una vez realizado el entrenamiento, Trained aparece junto al modelo. Puede obtener una vista previa del archivo del modelo, descargarlo y eliminarlo.

Uso de un modelo de lenguaje en un vídeo nuevo

Para usar el modelo de lenguaje en un vídeo nuevo, realice una de las siguientes acciones:

  1. Seleccione el botón Upload (Cargar) en la parte superior de la página.
  2. Coloque el archivo de audio o vídeo o busque el archivo.
  3. Seleccione un modelo de lenguaje que creó en la lista desplegable Idioma de origen de vídeo.
  4. Haga clic en la opción Cargar en la parte inferior de la página y el nuevo vídeo se indexará mediante el modelo de lenguaje.

Uso de un modelo de lenguaje para volver a indexar

  1. Inicie sesión en la página principal de Azure AI Video Indexer .
  2. Haga clic en el botón ... del vídeo y seleccione Volver a indexar.
  3. Seleccione la lista desplegable Idioma de origen de vídeo y seleccione un modelo de lenguaje que creó en la lista.
  4. Seleccione el botón Volver a indexar y el vídeo se volverá a indexar con el modelo de lenguaje.

Edición de un modelo de lenguaje

Puede editar un modelo de lenguaje cambiando su nombre, agregando archivos a él y eliminando archivos de él. Si agrega o elimina archivos del modelo de lenguaje, tendrá que volver a entrenar el modelo seleccionando la opción verde Train (Entrenar ).

Cambiar el nombre del modelo de lenguaje

Para cambiar el nombre del modelo de lenguaje, seleccione el botón de puntos suspensivos (...) situado en el lado derecho del modelo de lenguaje y seleccione Cambiar nombre. Escriba el nuevo nombre.

Incorporación de archivos

  1. Seleccione Add file (Agregar archivo). Se abrirá el explorador de archivos.
  2. Vaya al archivo de texto y selecciónelo. Puede agregar varios archivos de texto a un modelo de lenguaje.

También puede agregar un archivo de texto seleccionando el botón de puntos suspensivos (...) situado en el lado derecho del modelo de lenguaje y seleccionando Agregar archivo.

Eliminar archivos

Esta acción quita completamente el archivo del modelo de lenguaje.

  1. Seleccione el botón de puntos suspensivos (...) situado en el lado derecho del archivo de texto.
  2. Seleccione Eliminar. Aparece una nueva ventana que le indica que la eliminación no se puede deshacer.
  3. Seleccione la opción Eliminar en la nueva ventana.

Eliminación de un modelo de lenguaje

Esta acción quita completamente el modelo de lenguaje de la cuenta. Cualquier vídeo que use el modelo deletedlLanguage mantendrá el mismo índice hasta que vuelva a indexar el vídeo. Si vuelve a indexar el vídeo, puede asignar un nuevo modelo de lenguaje al vídeo. De lo contrario, Video Indexer de Azure AI usará su modelo predeterminado para volver a indexar el vídeo.

  1. Seleccione el botón de puntos suspensivos (...) situado a la derecha del modelo de lenguaje.
  2. Seleccione Eliminar. Aparece una nueva ventana que le indica que la eliminación no se puede deshacer.
  3. Seleccione la opción Eliminar en la nueva ventana.

Personalización de modelos de lenguaje mediante la corrección de transcripciones

Video Indexer de Azure AI personaliza los modelos de lenguaje en función de las correcciones reales que realizan los usuarios en las transcripciones de sus vídeos. Captura todas las líneas que corrigió en la transcripción del vídeo y las agrega a un archivo de texto denominado From transcript edits. Estas modificaciones se usan para volver a entrenar el modelo de lenguaje que se usó para indexar el vídeo.

También se incluyen las modificaciones realizadas en la escala de tiempo del widget.

Si no especificó un modelo de lenguaje al indexar este vídeo, todas las ediciones de este vídeo se almacenan en un modelo de lenguaje predeterminado llamado Account adaptations dentro del idioma detectado del vídeo.

En caso de que se hayan realizado varias modificaciones en la misma línea, solo se usa la última versión de la línea corregida para actualizar el modelo de lenguaje.

Nota:

Solo las correcciones textuales se usan para la personalización. No se incluyen las correcciones que no impliquen palabras reales (por ejemplo, los signos de puntuación o los espacios).

  1. Seleccione el vídeo que desea editar desde la biblioteca.
  2. Seleccione la pestaña Timeline (Escala de tiempo).
  3. Seleccione el icono del lápiz para editar la transcripción.
  4. Verá que las correcciones de transcripciones aparecen en la pestaña Idioma de la página personalización con modo carpa l. Seleccione el modelo de lenguaje que desee para ver su archivo "Ediciones de transcripción de origen".