Resumen
En este módulo, ha aprendido a optimizar el rendimiento del modelo de IA generativa mediante estrategias complementarias en Microsoft Foundry.
Ha aprendido a:
- Aplique técnicas de ingeniería de solicitudes, incluidos mensajes del sistema, aprendizaje con pocos ejemplos y parámetros de modelo para optimizar los resultados del modelo.
- Comprenda cuándo y cómo anclar un modelo de lenguaje mediante Generación Aumentada con Recuperación (RAG).
- Identificar cuándo ajustar un modelo mejora la coherencia del comportamiento.
- Compare las estrategias de optimización y determine cuándo combinarlas.
La conclusión clave es que la ingeniería rápida, RAG y el ajuste fino no son enfoques competitivos, son estrategias complementarias que abordan diferentes dimensiones del rendimiento del modelo. Comience con la ingeniería de instrucciones para guiar el comportamiento del modelo, añada RAG cuando la precisión fáctica requiera datos específicos del dominio, y considere el ajuste fino cuando necesite un estilo y un formato coherentes que la ingeniería de instrucciones por sí sola no pueda lograr de forma confiable.
En el caso de la agencia de viajes, la solución más eficaz podría combinar las tres: un modelo ajustado que mantenga la voz de la marca, RAG que base las respuestas en el catálogo real del hotel y una ingeniería rápida que agregue solicitudes específicas para la conversación y medidas de seguridad.
Aprende más
- Comenzando con la personalización de un modelo de lenguaje grande (LLM)
- Técnicas de ingeniería de solicitudes
- diseño de mensajes del sistema
- Generación aumentada de recuperación en Microsoft Foundry
- Personalizar un modelo con ajuste fino
- Consideraciones de ajuste fino deMicrosoft Foundry
- Augmenta modelos de lenguaje de gran tamaño con RAG o ajuste fino