Comparteix via


Diseñar comprensión eficaz del lenguaje

La comprensión del lenguaje natural (NLU) está en el núcleo de cómo los agentes de Copilot Studio entienden las consultas de los usuarios y proporcionan respuestas relevantes y contextuales. Un enfoque bien definido para el reconocimiento de intenciones, la extracción de entidades y la gestión de respaldo garantiza que los agentes mantengan conversaciones eficientes y naturales que se ajusten a las necesidades del negocio.

Cuando un usuario introduce algo a un agente, se conoce como enunciado. El agente necesita descomponer esa expresión en intención y entidades, haciendo que su respuesta se sienta tanto natural como eficiente.

¿Qué es la comprensión del idioma?

La comprensión del lenguaje (LU) es una subdisciplina del Procesamiento del Lenguaje Natural (PLN) centrada en permitir que las máquinas comprendan el significado, la intención y el contexto detrás del lenguaje humano.

Diagrama que ilustra el procesamiento de la comprensión del lenguaje.

Diagrama que muestra cómo se desglosa el mensaje de un usuario en intención y entidades. Una persona escribe: "Quiero reservar un vuelo a París la semana que viene." El mensaje se etiqueta como una enunciación. La frase "quiero reservar un vuelo" se identifica como la intención, y "París" y "la próxima semana" se identifican como entidades. El sistema entonces solicita más detalles como la ciudad de salida y la clase de viaje. El diagrama ilustra cómo el agente utiliza la intención, las entidades y el contexto para determinar la mejor respuesta.

La comprensión del idioma implica:

  • Reconocimiento de intención: Identificar lo que el usuario quiere lograr (por ejemplo, "Reservar un vuelo a París la próxima semana" corresponde a la intención de reservar un vuelo).
  • Extracción de entidades: Extraer detalles clave como fechas, ubicaciones o nombres (por ejemplo, "París" como destino, "semana siguiente" como fecha de viaje).
  • Conciencia del contexto: mantener la continuidad y resolver ambigüedades en la conversación (por ejemplo, entender pronombres o referencias).
  • Manejo de ambigüedades: Utilizar el contexto para resolver palabras con múltiples significados (por ejemplo, "banco" como institución financiera o orilla de río).

Comprensión del idioma en Copilot Studio

Copilot Studio tiene un modelo flexible para la comprensión del lenguaje, con múltiples opciones de configuración.

Orquestación generativa

La orquestación generativa utiliza modelos de lenguaje para encadenar inteligentemente temas, acciones y conocimientos. Esta capacidad permite el reconocimiento multi-intencion, la extracción avanzada de entidades y la generación dinámica de planes para consultas complejas.

Este método es el predeterminado de Copilot Studio. Este enfoque reconoce múltiples intenciones o temas en una sola enunciación, encadena automáticamente acciones y fuentes de conocimiento, y genera respuestas unificadas. Es especialmente útil para gestionar conversaciones complejas que abarcan múltiples áreas de negocio. La orquestación generativa tiene límites, como cinco mensajes por tema o cadena de acciones, y 128 temas o acciones por orquestación, pero proporciona una forma poderosa de escalar la amplitud de la conversación.

Aprende más en Aplicar capacidades de orquestación generativa.

Orquestación clásica

La orquestación clásica utiliza frases desencadenantes y enrutamiento determinista de temas. Si la expresión de un usuario coincide con una frase desencadenante, se ejecuta el tema correspondiente. Si no hay coincidencia, los mecanismos de respaldo buscan fuentes de conocimiento o piden al usuario que aclare.

NLU integrado

Este enfoque era el estándar, pero ahora es el método de respaldo. Copilot Studio ofrece un modelo NLU estándar que soporta frases de disparo, entidades predefinidas y entidades personalizadas. Este modelo permite a los agentes identificar la intención del usuario y extraer detalles clave como fechas, destinos o cantidades directamente de una consulta.

NLU+

Para mayor precisión, utiliza la opción NLU+. La opción NLU+ es ideal para aplicaciones de gran nivel empresarial. Estos tipos de aplicaciones normalmente constan de un gran número de temas y entidades, y usan un gran número de ejemplos de entrenamiento. Además, si tiene un agente habilitado para voz, los datos de entrenamiento de NLU+ también se usan para optimizar las funcionalidades de reconocimiento de voz.

Azure CLU integration

Para escenarios más avanzados donde no puedes usar la orquestación generativa por defecto, puedes integrar Azure Conversational Language Understanding (CLU). CLU ofrece una mayor personalización, soporte multilingüe y extracción de entidades complejas (por ejemplo, múltiples entidades "de"). Debes asignar las intenciones de CLU a los temas de Copilot Studio para mantenerlos sincronizados. Esta opción es especialmente valiosa para vocabularios específicos del sector, idiomas no ingleses o situaciones que requieren mayor precisión.

Características principales y limitaciones

Esta tabla compara los tres enfoques de comprensión del lenguaje en Copilot Studio. Destaca sus características clave y limitaciones para ayudarte a elegir el modelo adecuado para las necesidades de complejidad, escala y precisión de tu agente.

Características y limitaciones Orquestación generativa Modelo NLU integrado Modelo Azure CLU personalizado
Características clave
  • Utiliza un modelo de lenguaje grande
  • Maneja enunciados complejos con múltiples intenciones, temas/acciones y conocimientos
  • Genera automáticamente preguntas por entradas faltantes
  • Permite correcciones mientras se ejecuta
  • Produce una respuesta unificada basada en los resultados de los temas, acciones y conocimientos
  • Modelo preentrenado por defecto con tipos de entidades predefinidos
  • Configurado usando frases desencadenantes y entidades personalizadas (listas cerradas o regex)
  • Soporta más lenguajes con modelos nativos
  • Modelo personalizable de desencadenante de intención para precisión o necesidades específicas del sector
  • Extracción avanzada de entidades (por ejemplo, del mismo tipo, extracción silenciosa)
  • La extracción de entidades puede usar el estándar de Copilot Studio NLU
Limits
  • Cinco mensajes por tema/cadena de acciones
  • Límite de 128 temas y acciones para desencadenar
  • Reconocimiento de intención única por consulta
  • No se puede extender
  • Rellenar múltiples entidades del mismo tipo requiere desambiguación
  • Reconocimiento de intención única por consulta
  • Configuración basada en Azure y costes adicionales
  • Has límites de servicio en Azure
  • Los intentos de Azure CLU y los temas de Copilot Studio deben mantenerse cuidadosamente sincronizados.

Aprende más en Resumen sobre el aprendizaje del lenguaje natural (NLU).

Estructura temática y respaldo

Los temas han pasado de un camino rígido basado en la intención hacia un enfoque más flexible y centrado en la orquestación. En lugar de depender únicamente de disparadores y caminos predefinidos, los temas ahora actúan como instrucciones modulares a las que el agente puede recurrir al orquestar una conversación. La orquestación generativa gestiona la mayor parte del enrutamiento interpretando dinámicamente la entrada del usuario, y los temas proporcionan un respaldo estructurado cuando se necesita precisión.

El diseño más tradicional y estructurado de los temas hace que las conversaciones se sientan naturales y eficientes. Los temas pueden ser puntos de entrada activados por enunciados del usuario o subtemas reutilizables llamados por redirecciones o eventos del sistema. Los temas de desambiguación ayudan a evitar confusiones cuando se pueden activar múltiples temas, mientras que los temas de respaldo y de fomento conversacional proporcionan redes de seguridad cuando el agente no puede corresponder con confianza a la intención. También puedes añadir respuestas generativas para extraer fuentes externas de conocimiento, asegurando que los usuarios rara vez se queden sin respuesta.

Aprende más en Aplicar las mejores prácticas a los temas de redacción.

Localización e idiomas

El lenguaje utilizado por un agente de Copilot Studio está determinado por el valor de la variable del sistema: System.User.Language.

Esta variable actúa como punto de control central para todo comportamiento relacionado con el lenguaje en el agente. Puedes establecer su valor manualmente, programáticamente o detectarlo automáticamente.

¿Cómo funciona?

  • Buscar conocimiento en el idioma del usuario: Copilot Studio utiliza el valor de System.User.Language para buscar fuentes de conocimiento en el idioma especificado. Este enfoque significa que, incluso si un usuario hace una pregunta en un idioma, el agente traduce la consulta de búsqueda al conjunto de idiomas en System.User.Language (traducción automática para consulta de búsqueda).

  • Responder en el idioma del usuario: El agente genera respuestas en el idioma especificado por System.User.Language, independientemente del idioma usado en la pregunta o de los documentos originales (traducción automática para generación de respuestas).

  • Anulación manual: Puedes establecer manualmente el valor de System.User.Language para forzar al agente a operar en un lenguaje específico. Esta función es útil para pruebas o para escenarios en los que debes controlar explícitamente el lenguaje. Obtenga más información en Configuración y creación de agentes multilingües.

Detección automática de lenguaje hablado

Puedes configurar Copilot Studio para detectar automáticamente el lenguaje hablado o escrito del usuario y establecer la System.User.Language variable en consecuencia. Esta función permite experiencias multilingües fluidas sin necesidad de especificar su preferencia lingüística.

Cómo funciona la autodetección

  • Detección basada en disparadores: Cuando el bot recibe un mensaje, un disparador inicia un flujo de detección de idiomas.
  • Establecer variable del sistema: El bot asigna el lenguaje detectado a System.User.Language.
  • Respuesta dinámica: El agente continúa la conversación en el idioma detectado, tanto buscando conocimiento como generando respuestas en consecuencia.

Ventajas

  • Experiencia personalizada: Los usuarios interactúan en su idioma preferido sin configuración manual.
  • Experiencia consistente: Todas las respuestas y recuperaciones de conocimiento se alinean con el lenguaje detectado o establecido.
  • Solución escalable: Soporta despliegues globales con configuración mínima.

Sugerencia

Revisa la solución de ejemplo que demuestra cómo permitir que los agentes de Copilot Studio detecten automáticamente el lenguaje hablado de un usuario y cambia a uno de los lenguajes aprobados por el fabricante para el agente: Lenguaje de detección automática para respuestas generativas

Mejores prácticas para la localización

  • Configurar lenguajes compatibles: Definir lenguajes primarios y secundarios para tu agente. Utiliza archivos de localización (JSON o ResX) para proporcionar traducciones de prompts, mensajes y temas.
  • Prueba escenarios multilingües: Simula interacciones de usuario en diferentes idiomas para asegurar transiciones suaves y respuestas precisas.
  • Utiliza la traducción automática: Confía en la traducción integrada de Copilot Studio para la búsqueda de conocimiento y generación de respuestas, pero proporciona traducciones personalizadas para contenido crítico o matizado.
  • Monitorizar y refinar: Utilizar análisis para rastrear el uso del idioma y mejorar la cobertura de localización con el tiempo.

Enfoques del lenguaje de los agentes de Copilot Studio:

  • Agentes separados por idioma.
  • Agentes multilingües únicos con traducciones preautocadas.
  • Agentes multilingües en tiempo real, utilizando servicios de traducción entre usuario y agente.

El enfoque adecuado depende del uso, las preocupaciones sobre la separación, la escala, la frecuencia de actualización y los recursos disponibles.

Desafíos técnicos identificados

Los desafíos típicos incluyen asegurar que los temas de Azure CLU y Copilot Studio se mantengan sincronizados, gestionar enunciados ambiguos y escalar despliegues multilingües. La identificación temprana de estos obstáculos permite planificar estrategias de mitigación, como configuraciones de respaldo, pruebas masivas de frases desencadenantes o servicios de traducción basados en retransmisores.

El objetivo de la comprensión del lenguaje es asegurar que cada agente pueda interpretar las consultas de los usuarios con precisión, adaptarse a diversos lenguajes y escenarios, y manejar con elegancia lo inesperado. Este objetivo crea una base sólida para construir conversaciones fiables, atractivas y eficientes en Copilot Studio.