Introducción

Completado

Los modelos de lenguaje son herramientas eficaces para crear aplicaciones de IA generativas, pero un modelo base por sí solo podría no cumplir todos sus requisitos. La calidad, la precisión y la coherencia de las respuestas que genera un modelo dependen de cómo se configura y aumenta.

Imagine que es un desarrollador que trabaja para una agencia de viajes. Va a crear una aplicación de chat para ayudar a los clientes con sus preguntas relacionadas con los viajes. El modelo base proporciona respuestas decentes, pero su equipo tiene necesidades específicas: las respuestas deben seguir el tono de voz de la empresa, incluir información precisa sobre el catálogo de hoteles y mantener un formato coherente entre interacciones. ¿Cómo hace que el modelo rinda a este nivel?

Hay varias estrategias complementarias que puede usar para optimizar el rendimiento de un modelo de IA generativo. Estas estrategias van desde ajustes rápidos y de bajo costo hasta técnicas más implicadas que requieren tiempo y recursos adicionales.

Diagrama en el que se muestran las distintas estrategias para optimizar el rendimiento del modelo, desde la ingeniería rápida a RAG y el ajuste preciso.

En este módulo, explorará cada una de estas estrategias y aprenderá cuándo y cómo aplicarlas individualmente o en combinación.

En este módulo, aprenderá a:

  • Aplique técnicas de ingeniería de solicitudes, incluidos mensajes del sistema, aprendizaje con pocos ejemplos y parámetros de modelo para optimizar los resultados del modelo.
  • Comprenda cuándo y cómo anclar un modelo de lenguaje mediante Generación Aumentada con Recuperación (RAG).
  • Identificar cuándo ajustar un modelo mejora la coherencia del comportamiento.
  • Compare las estrategias de optimización y determine cuándo combinarlas.

Prerrequisitos

  • Familiaridad con los conceptos y servicios fundamentales de inteligencia artificial en Azure.
  • Conocimientos básicos de los modelos de ia generativa y cómo generan respuestas.