Introdução
Os modelos de linguagem são ferramentas poderosas para construir aplicações de IA generativa, mas um modelo base por si só pode não satisfazer todos os seus requisitos. A qualidade, precisão e consistência das respostas geradas por um modelo dependem de como o configura e aumenta.
Imagine que você é um desenvolvedor trabalhando para uma agência de viagens. Está a criar uma aplicação de chat para ajudar os clientes com as suas dúvidas relacionadas com viagens. O modelo base dá respostas decentes, mas a sua equipa tem necessidades específicas: as respostas devem seguir o tom de voz da empresa, incluir informações precisas sobre o catálogo do seu hotel e manter um formato consistente nas interações. Como consegues que o modelo tenha um desempenho a este nível?
Existem várias estratégias complementares que pode usar para otimizar o desempenho de um modelo de IA generativa. Estas estratégias vão desde ajustes rápidos e de baixo custo até técnicas mais complexas que exigem tempo e recursos adicionais.
Ao longo deste módulo, explora cada uma destas estratégias e aprende quando e como aplicá-las individualmente ou em combinação.
Neste módulo, você aprenderá a:
- Aplique técnicas de engenharia de prompts, incluindo mensagens do sistema, aprendizagem com poucos exemplos e parâmetros de modelo para otimizar a saída do modelo.
- Compreenda quando e como fundamentar um modelo de linguagem usando Geração Aumentada por Recuperação (RAG).
- Identifique quando o ajuste fino de um modelo melhora a consistência comportamental.
- Compare estratégias de otimização e determine quando as combinar.
Pré-requisitos
- Familiaridade com conceitos e serviços fundamentais de IA no Azure.
- Uma compreensão básica dos modelos de IA generativa e de como geram respostas.