Grabaciones de voz
Importante
LUIS se retirará el 1 de octubre de 2025. Además, a partir del 1 de abril de 2023, ya no se podrán crear recursos de este servicio. Se recomienda migrar las aplicaciones de LUIS al reconocimiento del lenguaje conversacional para aprovechar el soporte continuo del producto y las capacidades multilingües.
Las expresiones son datos que proporcionan los usuarios y que la aplicación tiene que interpretar. Para entrenar a LUIS para que extraiga intenciones y entidades estos datos, es importante capturar varias expresiones de ejemplo diferentes por cada intención. El aprendizaje activo o el proceso de continuar entrenando expresiones nuevas es esencial para la inteligencia de aprendizaje automático que proporciona LUIS.
Recopile expresiones que crea que los usuarios pueden escribir. Incluya expresiones que signifiquen lo mismo, pero que se construyen de maneras diferentes:
- Longitud de expresión: corta, media o larga para la aplicación cliente
- Longitud de la palabra y frase
- Ubicación de las palabras: entidad al principio, en el medio o al final de una expresión
- Gramática
- Pluralización
- Raíz
- Elección del nombre y del verbo
- Puntuación, con gramática tanto correcta como incorrecta
Elección de expresiones variadas
Cuando empiece a agregar expresiones de ejemplo al modelo de LUIS, hay varios principios que debe tener en cuenta:
Las expresiones no siempre tienen el formato correcto
Es posible que la aplicación tenga que procesar oraciones, como "Reservar un billete a París para mí", o frases, como "Reservar" o "Vuelo a París". Los usuarios a menudo cometen errores ortográficos. Al planear la aplicación, tenga en cuenta si quiere usar Bing Spell Check para revisar la ortografía de la entrada del usuario o no, antes de pasarla a LUIS.
Si no revisa la ortografía de las expresiones del usuario, debe entrenar a LUIS en expresiones que incluyan errores tipográficos y faltas de ortografía.
Utilice el lenguaje representativo del usuario
Al elegir expresiones, tenga en cuenta que lo que cree que son términos o frases comunes tal vez no sean correctos para el típico usuario de la aplicación cliente. Es posible que no tengan experiencia en ese campo o que se use una terminología diferente. Preste atención al utilizar términos o frases que solo las diría un experto.
Elección de terminología y estilos variados
Observará que aunque realice esfuerzos para crear patrones de frases variadas,se seguirá repitiendo algo de vocabulario. Por ejemplo, las siguientes expresiones tienen un significado similar, pero terminología y estilos diferentes:
- "¿Cómo puedo obtener un equipo?"
- "¿Dónde puedo obtener un equipo?"
- "Quiero obtener un equipo, ¿cómo lo hago?"
- "¿Cuándo puedo tener un equipo?"
En este caso, el término principal, equipo, no varía. Use alternativas como "equipo de escritorio", "portátil", "estación de trabajo" o incluso simplemente "máquina". LUIS puede deducir de forma inteligente los sinónimos a partir del contexto, pero cuando se crean expresiones para el entrenamiento, siempre es mejor variarlas.
Expresiones de ejemplo en cada intención
Cada intención debe tener expresiones de ejemplo, al menos 15. Si tiene una intención que no tiene ninguna expresión de ejemplo, no podrá entrenar a LUIS. Si dispone de una intención con una o pocas expresiones de ejemplo, es posible que LUIS no pueda predecirla con precisión.
Adición de pequeños grupos de expresiones
Cada vez que itera el modelo para mejorarlo, no agregue grandes cantidades de expresiones. Agregue de a unas 15 expresiones. Luego entrene, publique y vuelva a probar.
LUIS compila modelos efectivos con expresiones seleccionadas cuidadosamente por su autor de modelos. Agregar demasiadas expresiones no resulta útil porque genera confusión.
Es mejor empezar con pocas expresiones y, luego, revisar las expresiones del punto de conexión para que la extracción de la entidad y la predicción de la intención se realicen correctamente.
Normalización de expresiones
La normalización de expresiones es el proceso de omitir los efectos de los tipos de texto, como la puntuación y las marcas diacríticas, durante el entrenamiento y la predicción.
La configuración de la normalización de expresiones está desactivada de manera predeterminada. Esta configuración incluye:
- Formas de las palabras
- Marcas diacríticas
- Signos de puntuación
Si activa la configuración de normalización, las puntuaciones del panel Prueba, las pruebas por lotes y las consultas de puntos de conexión cambiarán en todas las expresiones que usen esa configuración de normalización.
Al clonar una versión en el portal de LUIS, la configuración de la versión se mantiene con la nueva versión clonada.
Para establecer la configuración de la versión de la aplicación mediante el portal de LUIS, seleccione Administrar en el menú de navegación superior, en la página Configuración de la aplicación. También puede usar la API de actualización de la configuración de la versión. Consulte la documentación de referencia para obtener más información.
Formas de las palabras
Normalizar las formas de las palabras omite las diferencias en las palabras que se expanden más allá de la raíz.
Marcas diacríticas
Los signos diacríticos son marcas o signos dentro del texto, como:
İ ı Ş Ğ ş ğ ö ü
Signos de puntuación
Normalizar la puntuación significa que antes de que los modelos se entrenen y antes de que las consultas de punto de conexión se predigan, la puntuación se quitará de las expresiones.
Los signos de puntuación son un token independiente de LUIS. Una expresión que contiene un punto final es una expresión distinta de otra que no tenga un punto final, y podría tener dos predicciones diferentes.
Si la puntuación no se normaliza, LUIS tiene en cuenta los signos de puntuación de forma predeterminada, ya que es posible que estos signos tengan una mayor importancia en algunas aplicaciones cliente. Asegúrese de incluir expresiones de ejemplo que usen signos de puntuación y otras que no, para que ambos estilos devuelvan las mismas puntuaciones relativas.
Asegúrese de que el modelo controle los signos de puntuación, ya sea en las expresiones de ejemplo (así tengan signos de puntuación o no) o en los patrones, donde es más sencillo pasar por alto los signos de puntuación. Por ejemplo: Me postulo para el puesto {Job}[.]
Si la puntuación no tiene un significado concreto en la aplicación cliente, podría omitir la puntuación mediante la normalización de la puntuación.
Omisión de palabras y puntuación
Si quiere omitir palabras o signos de puntuación específicos en los patrones, use un patrón con la sintaxis ignore de corchetes, []
.
Entrenamiento con todas las expresiones
El entrenamiento no es determinista: la predicción de expresiones puede variar ligeramente entre versiones o aplicaciones. Puede quitar el aprendizaje no determinista actualizando la API de configuración de versión con el par nombre-valor UseAllTrainingData para que así pueda utilizar todos los datos de entrenamiento.
Prueba de expresiones
Los desarrolladores deben empezar a probar su aplicación de LUIS con datos reales mediante el envío de expresiones a la URL del punto de conexión de predicción. Estas expresiones se utilizan para mejorar el rendimiento de las intenciones y las entidades con la revisión de expresiones. Las pruebas enviadas mediante el panel de pruebas del portal de LUIS no se envían a través del punto de conexión y no contribuyen al aprendizaje activo.
Revisión de las expresiones
Una vez que el modelo esté entrenado, publicado y reciba consultas del punto de conexión, revise las expresiones sugeridas por LUIS. LUIS selecciona expresiones del punto de conexión que tienen puntuaciones bajas, ya sea para la intención o para la entidad.
Procedimientos recomendados
Etiqueta para el significado de las palabras
Si la elección o la organización de las palabras es la misma pero no significa lo mismo, no la etiquete con la entidad.
En las siguientes expresiones, la palabra "cerca" es un homógrafo, lo que significa que se escribe igual, pero tiene un significado diferente:
- "¿Qué tipo de ferias locales se producen cerca de Seattle este verano?"
- "¿Dónde puedo encontrar una casa de 2 plantas y cerca alrededor?"
Si quiere que una entidad de evento busque todos los datos de eventos, etiquete la palabra "cerca" en la primera expresión, pero no en la segunda.
No ignore las posibles variaciones de expresiones
LUIS espera variaciones en las expresiones de una intención. Las expresiones pueden variar y conservar el mismo significado general. Las variaciones pueden incluir la longitud de la expresión, así como la elección y ubicación de las palabras.
No usar el mismo formato | Usar formatos variados |
---|---|
Comprar un billete a Seattle | Comprar 1 billete a Seattle |
Comprar un billete a París | Reservar dos billetes en el vuelo nocturno a París el próximo lunes |
Comprar un billete a Orlando | Quiero adquirir 3 billetes a Orlando para las vacaciones de primavera |
El la segunda columna se usan otros verbos (comprar, reservar y adquirir), otras cantidades (1, "dos" y 3), y otras colocaciones de las palabras, pero todas tienen la misma intención de comprar billetes de avión para viajar.
No agregar demasiadas expresiones de ejemplo a las intenciones
Una vez publicada la aplicación, agregue solo expresiones de aprendizaje activo en el proceso de ciclo de vida del desarrollo. Si las expresiones son demasiado similares, agregue un patrón.