Detección de la base de datos

Artículo
09/26/2024

La API de detección de la base detecta si las respuestas de texto de los modelos de lenguaje grande (LLM) se basan en los materiales de origen proporcionados por los usuarios. La ausencia de base hace referencia a aquellas instancias en las que los LLM producen información no factual o inexacta de lo que estaba presente en los materiales de origen.

Términos clave

Generación aumentada de recuperación (RAG): RAG es una técnica para aumentar el conocimiento de LLM con otros datos. Los LLM pueden razonar sobre temas de amplio alcance, pero su conocimiento se limita a los datos públicos que estaban disponibles en el momento de su entrenamiento. Si desea compilar aplicaciones de IA que puedan razonar sobre los datos privados o los datos presentados después de la fecha límite de un modelo, debe proporcionar al modelo esa información específica. El proceso de traer la información adecuada e insertarla en la solicitud del modelo se conoce como Generación aumentada de recuperación (RAG). Para obtener más información, consulte Generación aumentada de recuperación (RAG).
Fundamentos y ausencia de los mismos en los LLM: esto hace referencia a la medida en que los resultados del modelo se basan en la información proporcionada o reflejan las fuentes de confianza de forma precisa. Una respuesta con base se ajusta estrechamente a la información proporcionada, lo que evita la especulación o la fabricación. En las medidas de la base, la información de origen es fundamental y actúa como origen de base.

Opciones de detección de fundamentos

Las siguientes opciones están disponibles para la detección de fundamentos en Seguridad del contenido de Azure AI:

Selección de dominio: los usuarios pueden elegir un dominio establecido para garantizar una detección más personalizada que se adapte a las necesidades específicas de su campo. Actualmente, los dominios disponibles son MEDICAL y GENERIC.
Especificación de tareas: esta característica permite seleccionar la tarea que está realizando, como QnA (preguntas y respuestas) y Resumen, con una configuración ajustable según el tipo de tarea.
Velocidad frente a interpretabilidad: hay dos modos que compensan la velocidad con la interpretabilidad de los resultados.
- Modo sin razonamiento: ofrece una funcionalidad de detección rápida, fácil de insertar en aplicaciones en línea.
- Modo de razonamiento: ofrece explicaciones detalladas de segmentos sin base; mejor para la comprensión y mitigación.

Casos de uso

La detección de la base admite tareas de Resumen y Preguntas y respuestas basadas en texto para garantizar que los resúmenes o respuestas generados sean precisos y de confianza. A continuación, se muestran algunos ejemplos de cada caso de uso:

Tareas de resumen:

Resumen médico: en el contexto de los artículos de noticias médicas, se puede usar la detección de la base para asegurarse de que el resumen no contiene información creada o engañosa, lo que garantiza que los lectores obtengan información médica precisa y de confianza.
Resumen de documentos académicos: cuando el modelo genera resúmenes de documentos académicos o artículos de investigación, la función puede ayudar a garantizar que el contenido resumido represente de forma precisa los resultados y contribuciones clave sin presentar notificaciones falsas.

Tareas de QnA:

Bots de chat de soporte al cliente: en el soporte al cliente, la función se puede usar para validar las respuestas proporcionadas por los bots de chat de inteligencia artificial, lo que garantiza que los clientes reciban información precisa y de confianza cuando formulan preguntas sobre productos o servicios.
Preguntas y respuestas médicas: en el caso de las preguntas y respuestas médicas, la función ayuda a comprobar la precisión de las respuestas médicas y el asesoramiento proporcionado por los sistemas de inteligencia artificial a los profesionales de atención sanitaria y pacientes, lo que reduce el riesgo de errores médicos.
Preguntas y respuestas educativas: en contextos educativos, la función se puede aplicar a las tareas de preguntas y respuestas para confirmar que las respuestas a preguntas académicas o las consultas de preparación de pruebas son objetivamente precisas, respaldando el proceso de aprendizaje.

Corrección de los fundamentos

La API de detección de fundamentos incluye una característica de corrección que corrige automáticamente cualquier falta de fundamento detectada en el texto en función de las fuentes proporcionadas. Cuando se habilita la característica de corrección, la respuesta incluye un campo corrected Text que presenta el texto corregido alineado con el origen.

A continuación, vea varios escenarios comunes que ilustran cómo y cuándo aplicar estas características para lograr los mejores resultados.

Resumen en contextos médicos

Caso de uso:

Va a resumir documentos médicos y es fundamental que los nombres de los pacientes de los resúmenes sean precisos y coherentes con las fuentes proporcionadas.

Solicitud de API de ejemplo:

{
  "domain": "Medical",
  "task": "Summarization",
  "text": "The patient name is Kevin.",
  "groundingSources": [
    "The patient name is Jane."
  ],
}

Resultado esperado:

La característica de corrección detecta que Kevin no está fundamentado porque entra en conflicto con el origen Jane. La API devuelve el texto corregido: "The patient name is Jane."

Tarea de preguntas y respuestas con datos de soporte técnico al cliente

Caso de uso:

Va a implementar un sistema de preguntas y respuestas para un bot de chat de soporte al cliente. Es esencial que las respuestas proporcionadas por la inteligencia artificial se ajusten con la información más reciente y precisa disponible.

Solicitud de API de ejemplo:

{
  "domain": "Generic",
  "task": "QnA",
  "qna": {
    "query": "What is the current interest rate?"
  },
  "text": "The interest rate is 5%.",
  "groundingSources": [
    "As of July 2024, the interest rate is 4.5%."
  ],
}

Resultado esperado:

La API detecta que 5% no está fundamentado porque no coincide con el origen 4.5% proporcionado. La respuesta incluye el texto de corrección: "The interest rate is 4.5%."

Creación de contenido con datos históricos

Caso de uso: está creando contenido que implique datos o eventos históricos, donde la precisión es fundamental para mantener la credibilidad y evitar errores de información.

Solicitud de API de ejemplo:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "The Battle of Hastings occurred in 1065.",
  "groundingSources": [
    "The Battle of Hastings occurred in 1066."
  ],
}

Resultado esperado: a API detecta la fecha 1065 sin fundamentación y la corrige a 1066 basándose en el origen. La respuesta incluye el texto corregido: "The Battle of Hastings occurred in 1066."

Resumen de documentación interna

Caso de uso:

Va a resumir documentos internos en los que los nombres de producto, los números de versión u otros puntos de datos específicos deben ser coherentes.

Solicitud de API de ejemplo:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "Our latest product is SuperWidget v2.1.",
  "groundingSources": [
    "Our latest product is SuperWidget v2.2."
  ],
}

Resultado esperado:

La característica de corrección identifica SuperWidget v2.1 como no fundamentado y lo actualiza a SuperWidget v2.2 en la respuesta. La respuesta devuelve el texto corregido: "Our latest product is SuperWidget v2.2."

procedimientos recomendados

Siga los siguientes procedimientos recomendados al configurar sistemas RAG para sacar el mejor rendimiento de la API de detección de fundamentos:

Cuando se trate de nombres de productos o números de versión, use fuentes fundamentadas directamente de las notas de la versión interna o de la documentación oficial del producto para garantizar su exactitud.
En el caso de los contenidos históricos, coteje las fuentes con bases de datos académicas o históricas de confianza para garantizar el máximo nivel de precisión.
En un entorno tan dinámico como el financiero, use siempre las fuentes fundamentadas más recientes y fiables para asegurarse de que su sistema de IA proporciona información precisa y oportuna.
Asegúrese siempre de que las fuentes fundamentadas sean precisas y estén actualizadas, especialmente en campos sensibles, como la atención sanitaria. Esto minimiza el riesgo de errores en el proceso de resumen.

Limitaciones

Disponibilidad del idioma

Actualmente, la API de detección de la base admite contenido en inglés. Aunque nuestra API no restringe el envío de contenido que no está en inglés, no podemos garantizar el mismo nivel de calidad y precisión en el análisis del contenido en otro idioma. Se recomienda que los usuarios envíen contenido principalmente en inglés para garantizar los resultados más confiables y precisos de la API.

Limitaciones de longitud del texto

Consulte Requisitos de entrada para conocer las limitaciones máximas de longitud de texto.

Regions

Para usar esta API, debe crear el recurso de Seguridad del contenido de Azure AI en las regiones admitidas. Consulte Disponibilidad de la región.

Limitaciones de velocidad

Consulte Tasas de consulta.

Si necesita una tarifa más alta, póngase en contacto con nosotros para solicitarla.

Pasos siguientes

Siga el inicio rápido para empezar a usar la seguridad del contenido de Azure AI para detectar la base.

Inicio rápido de la detección de la base

Compartir vía

Detección de la base de datos

Términos clave

Opciones de detección de fundamentos

Casos de uso

Corrección de los fundamentos

Resumen en contextos médicos

Tarea de preguntas y respuestas con datos de soporte técnico al cliente

Creación de contenido con datos históricos

Resumen de documentación interna

procedimientos recomendados

Limitaciones

Disponibilidad del idioma

Limitaciones de longitud del texto

Regions

Limitaciones de velocidad

Pasos siguientes

Comentarios

Recursos adicionales