Introducción
Los modelos de lenguaje son herramientas eficaces para crear aplicaciones de IA generativas, pero un modelo base por sí solo podría no cumplir todos sus requisitos. La calidad, la precisión y la coherencia de las respuestas que genera un modelo dependen de cómo se configura y aumenta.
Imagine que es un desarrollador que trabaja para una agencia de viajes. Va a crear una aplicación de chat para ayudar a los clientes con sus preguntas relacionadas con los viajes. El modelo base proporciona respuestas decentes, pero su equipo tiene necesidades específicas: las respuestas deben seguir el tono de voz de la empresa, incluir información precisa sobre el catálogo de hoteles y mantener un formato coherente entre interacciones. ¿Cómo hace que el modelo rinda a este nivel?
Hay varias estrategias complementarias que puede usar para optimizar el rendimiento de un modelo de IA generativo. Estas estrategias van desde ajustes rápidos y de bajo costo hasta técnicas más implicadas que requieren tiempo y recursos adicionales.
En este módulo, explorará cada una de estas estrategias y aprenderá cuándo y cómo aplicarlas individualmente o en combinación.
En este módulo, aprenderá a:
- Aplique técnicas de ingeniería de solicitudes, incluidos mensajes del sistema, aprendizaje con pocos ejemplos y parámetros de modelo para optimizar los resultados del modelo.
- Comprenda cuándo y cómo anclar un modelo de lenguaje mediante Generación Aumentada con Recuperación (RAG).
- Identificar cuándo ajustar un modelo mejora la coherencia del comportamiento.
- Compare las estrategias de optimización y determine cuándo combinarlas.
Prerrequisitos
- Familiaridad con los conceptos y servicios fundamentales de inteligencia artificial en Azure.
- Conocimientos básicos de los modelos de ia generativa y cómo generan respuestas.