Adaptar e estender agentes de IA para implantação
Os padrões de implementação da unidade anterior se aplicam a todos os agentes que você compilar. Cenários diferentes, no entanto, trazem requisitos diferentes. Um agente voltado para o cliente precisa de controles de privacidade e finesse de conversa, enquanto um agente de operações internas exige confiabilidade e conformidade. Esta unidade explora como adaptar a configuração e o comportamento do agente para essas duas categorias de implantação.
Agentes voltados para o cliente
Os agentes que interagem diretamente com os usuários finais, como assistentes de suporte ao cliente ou de vendas, exigem atenção extra para a qualidade, personalização e privacidade da conversa.
Qualidade da conversa
A mensagem do sistema é sua ferramenta principal para controlar a forma como o agente se comunica. Defina o tom, o estilo e o comprimento da resposta desejados:
- Tom e estilo: inclua diretrizes como "Responder de maneira amigável e profissional" ou "Usar linguagem simples e evitar jargões técnicos". Para um agente de apoio, um tom empático funciona bem. Para um assistente de vendas, um tom mais informativo pode ser apropriado.
- Esclarecendo perguntas: instrua o agente a pedir esclarecimentos quando uma solicitação é ambígua em vez de adivinhar. Por exemplo: "Se a solicitação do usuário não estiver clara, faça uma pergunta de esclarecimento educada antes de tomar medidas."
- Comprimento da resposta: guie o agente para manter as respostas concisas: "Mantenha as respostas em três frases, a menos que o usuário solicite mais detalhes".
Essas diretrizes podem ser refinadas iterativamente. Teste os fluxos de conversa com o agente e ajuste o prompt do sistema com base nos resultados.
Personalização e privacidade de dados
Os agentes voltados para o cliente geralmente acessam dados pessoais, como histórico de pedidos e detalhes da conta. Balancear a personalização com a proteção de privacidade:
- Injeção de contexto do usuário: quando uma sessão é iniciada, injete informações relevantes do usuário por meio do prompt do sistema ou do contexto inicial. Por exemplo, inclua o nome do usuário, a camada de conta e o histórico de pedidos recentes para que o agente possa fornecer um serviço personalizado.
- Instruções de privacidade: adicione regras explícitas ao prompt do sistema: "Discuta apenas os dados da conta do usuário conectado. Não revele códigos de referência internos ou informações confidenciais do sistema."
- Minimização de dados em ferramentas: se uma ferramenta recuperar informações confidenciais (como um endereço completo), filtre a resposta no manipulador de ferramentas para retornar apenas o que o agente precisa (como a cidade de envio).
Integração de conhecimento
Os agentes de suporte e vendas geralmente precisam de acesso a informações do produto, perguntas frequentes ou documentos de política que vão além dos dados de treinamento do modelo de IA. O padrão Retrieval-Augmented Generation (RAG) atende a esse requisito, dando ao agente uma ferramenta de pesquisa:
- Defina uma ferramenta como o
search_knowledge_base(query)que consulta a sua documentação ou sistema de perguntas frequentes. - Instrua o agente (por meio do prompt do sistema) a usar essa ferramenta ao responder perguntas sobre produtos ou políticas.
- Mantenha a base de dados de conhecimento atual para evitar respostas desatualizadas.
Essa abordagem fundamenta as respostas do agente em sua documentação real, em vez de depender dos dados de treinamento do modelo, o que reduz respostas imprecisas.
Entrega humana
Mesmo agentes bem configurados encontram situações que não podem resolver. Crie um caminho de escalonamento claro:
- Forneça uma
escalate_to_human(reason)ferramenta que transfira a conversa para um representante humano com todo o contexto que o agente reuniu. - Instrua o agente a usar esta ferramenta quando ele não conseguir resolver uma solicitação ou quando o usuário pedir explicitamente por um atendente humano.
- Durante a implantação inicial, considere rotear as respostas do agente por meio de uma fila de revisão humana antes de alcançar o cliente, para aumentar a confiança na qualidade do agente.
Back-office e agentes autônomos
Agentes que operam nos bastidores , como automação financeira, gerenciamento de cadeia de suprimentos ou agentes de operações de TI, priorizam a confiabilidade, a precisão e a integração com sistemas empresariais em vez da qualidade da conversa.
Determinismo e verificação
Nos processos empresariais, o comportamento previsível é fundamental:
-
Saídas estruturadas: interfaces de ferramenta de design para que o agente forneça valores de campo específicos em vez de texto de forma livre para entradas do sistema. Por exemplo, fazer com que o agente passe parâmetros estruturados para uma
create_journal_entry(account, amount, description)ferramenta em vez de gerar a entrada inteira como texto. -
Cálculos no código: use ferramentas para operações matemáticas em vez de depender do modelo de IA. Uma
calculate_tax(amount, rate)ferramenta produz resultados confiáveis, enquanto o modelo pode introduzir erros aritméticos. - Validação histórica: antes da implantação, execute o agente em relação aos dados históricos conhecidos e compare suas decisões com o que os humanos fizeram. Discrepâncias ajudam você a ajustar limites e instruções.
Agendamento e gatilhos
Ao contrário dos agentes interativos, os agentes de back-office geralmente são iniciados por eventos ou agendamentos em vez de entrada do usuário:
- Tarefas agendadas: um trabalho cron ou um serviço agendado cria uma sessão do SDK do GitHub Copilot, fornece contexto (como "executar a reconciliação diária de faturas" e permite que o agente execute.
- Controlado por eventos: um alerta de monitoramento ou webhook dispara a criação da sessão e envia os detalhes do evento como entrada. Cada evento normalmente recebe sua própria sessão para evitar a mistura de contextos.
- Execução sem estado: processe cada tarefa ou evento em uma sessão independente. Essa abordagem evita a confusão entre operações não relacionadas.
Integração do sistema empresarial
Os agentes de back-office interagem fortemente com APIs e bancos de dados. Crie robustez em seus manipuladores de ferramentas:
- Repetições e tempos limite: Implemente a lógica de repetição com retirada exponencial nos manipuladores de ferramentas que chamam sistemas externos.
- Segurança de transação: se o agente executar várias gravações relacionadas, considere usar uma única ferramenta que manipula a transação completa atomicamente, em vez de ferramentas separadas para cada etapa.
- Acesso com privilégios mínimos: use contas de serviço com permissões mínimas para chamadas à API do agente. Essa abordagem limita o efeito do comportamento inesperado.
- Log de auditoria: registre todas as ações que o agente realiza, incluindo qual ferramenta foi chamada, quais parâmetros foram passados e qual resultado foi retornado. Inclua um identificador que marca a ação como iniciada pelo agente.
Supervisão humana
Agentes autônomos ainda devem ter uma rede de segurança humana:
-
Alertas: forneça uma
notify_manager(issue)ferramenta que o agente pode usar quando encontrar situações fora de seu treinamento ou quando um problema persistir após várias tentativas. - Revisão periódica: os especialistas em domínio revisam regularmente as decisões do agente, especialmente durante a implantação antecipada.
- Substituição manual: Implemente um recurso de sinalização ou um interruptor de modo que permita alterar rapidamente o agente da execução autônoma para o modo consultivo, no qual ele registra recomendações, mas não executa nenhuma ação.
Considerações sobre desempenho e custo
Quando os agentes são executados com frequência ou processam grandes volumes, considere:
- Seleção de modelo: use um modelo mais rápido e menos caro para tarefas rotineiras e reserve modelos mais capazes para raciocínio complexo. O SDK permite configurar o modelo por sessão.
- Processamento em lote: se um agente precisar processar muitos itens, enquadrem o trabalho em uma única sessão em vez de criar uma sessão separada para cada item.
- Padrões de vários agentes: para fluxos de trabalho complexos, considere dividir as responsabilidades entre várias sessões com configurações e conjuntos de ferramentas diferentes. Um agente pode lidar com a análise enquanto outro manipula a execução, com seu aplicativo orquestrando entre eles.
Resumo
A adaptação do agente de IA para diferentes cenários de implantação envolve a personalização de seu estilo de conversa, conjunto de ferramentas e padrões operacionais para se ajustar ao caso de uso. Os agentes voltados para o cliente priorizam a qualidade e a personalização da conversa, mantendo a privacidade, enquanto os agentes de back-office se concentram na confiabilidade, integração e operação autônoma. Ao criar seu agente com essas considerações em mente, você pode maximizar sua eficácia e valor de negócios em qualquer contexto. Na próxima unidade, você verá como implementar essas adaptações na prática usando o SDK do GitHub Copilot.