Introdução

2 minutos

Os modelos de linguagem são ferramentas poderosas para construir aplicações de IA generativa, mas um modelo base por si só pode não satisfazer todos os seus requisitos. A qualidade, precisão e consistência das respostas geradas por um modelo dependem de como o configura e aumenta.

Imagine que você é um desenvolvedor trabalhando para uma agência de viagens. Está a criar uma aplicação de chat para ajudar os clientes com as suas dúvidas relacionadas com viagens. O modelo base dá respostas decentes, mas a sua equipa tem necessidades específicas: as respostas devem seguir o tom de voz da empresa, incluir informações precisas sobre o catálogo do seu hotel e manter um formato consistente nas interações. Como consegues que o modelo tenha um desempenho a este nível?

Existem várias estratégias complementares que pode usar para otimizar o desempenho de um modelo de IA generativa. Estas estratégias vão desde ajustes rápidos e de baixo custo até técnicas mais complexas que exigem tempo e recursos adicionais.

Diagrama que mostra as várias estratégias para otimizar o desempenho do modelo, desde a engenharia rápida até ao RAG e ajuste fino.

Ao longo deste módulo, explora cada uma destas estratégias e aprende quando e como aplicá-las individualmente ou em combinação.

Neste módulo, você aprenderá a:

Aplique técnicas de engenharia de prompts, incluindo mensagens do sistema, aprendizagem com poucos exemplos e parâmetros de modelo para otimizar a saída do modelo.
Compreenda quando e como fundamentar um modelo de linguagem usando Geração Aumentada por Recuperação (RAG).
Identifique quando o ajuste fino de um modelo melhora a consistência comportamental.
Compare estratégias de otimização e determine quando as combinar.

Pré-requisitos

Familiaridade com conceitos e serviços fundamentais de IA no Azure.
Uma compreensão básica dos modelos de IA generativa e de como geram respostas.

Comentários

Esta página foi útil?