Partilhar via


Práticas recomendadas para configurar seu agente de dados

Este artigo descreve as práticas recomendadas para configurar um agente de dados para fornecer respostas precisas, relevantes e úteis às perguntas dos usuários. Ao definir instruções claras no nível do agente e na fonte de dados, você pode orientar como o agente interpreta consultas, seleciona fontes de dados e gera respostas. Você aprenderá como definir o objetivo do agente, priorizar fontes de dados, incorporar terminologia chave e fornecer lógica de consulta para cenários comuns. Essas dicas de configuração ajudam a garantir que o agente tenha um desempenho confiável em diversos ambientes de dados e necessidades do usuário.

Para explorar os diferentes tipos de configurações do agente de dados, consulte Configurações do agente de dados.

1. Prepare sua IA de dados

Para garantir que o agente de dados possa gerar consultas precisas, é importante que suas fontes de dados, tabelas e colunas usem nomes claros e descritivos. Evite rótulos vagos ou genéricos como Table1, col1ou flag, que podem dificultar a interpretação da intenção do usuário pelo agente.

Menos eficaz:

  • Nomes de tabelas: Table1, Table2
  • Nomes das colunas: col1, status, flag

Melhor:

  • Nomes de tabelas: CustomerOrders, ProductCatalog, SalesTransactions, , OrderItems
  • Nomes das colunas: customer_email_address, order_submission_date, product_unit_price

A nomenclatura descritiva ajuda o agente a entender a estrutura de dados e melhora a qualidade das consultas geradas.

2. Crie agentes especializados para domínios específicos

Para maior precisão e relevância, projete agentes de dados focados em um domínio ou caso de uso específico, em vez de tentar lidar com uma ampla gama de perguntas. Os agentes especializados podem ser otimizados com instruções direcionadas, fontes de dados relevantes e terminologia específica do domínio, tornando-os mais confiáveis e eficazes.

Menos eficaz: Um agente de dados de uso geral que responde a uma ampla variedade de perguntas relacionadas ao cliente em diferentes personas de usuário

Melhor: Um agente de dados adaptado para apoiar a equipe de liderança, combinando insights de várias fontes de dados para a preparação da reunião

Ao restringir o foco do agente, você melhora sua capacidade de gerar respostas precisas e reduz a ambiguidade na interpretação da consulta.

3. Minimizar o escopo da fonte de dados

Inclua apenas as fontes de dados necessárias para responder às perguntas esperadas do usuário. Dentro de cada fonte de dados, selecione apenas as tabelas e colunas específicas que são relevantes para o seu caso de uso. Uma configuração mais focada melhora a capacidade do agente de gerar consultas precisas e eficientes.

Menos eficaz: Conectando um Lakehouse ou modelo inteiro com todas as tabelas e colunas

Melhor: Selecionar apenas as tabelas e colunas essenciais necessárias para consultas comuns

Sugestão

Para obter resultados ideais, limite o número de tabelas a 25 ou menos para uma determinada fonte de dados.

4. Seja específico sobre o que fazer, não apenas sobre o que não fazer

Em vez de apenas declarar o que o agente deve evitar, forneça orientações claras sobre a abordagem correta. Isso ajuda a evitar ambiguidade no tratamento de casos limite e permite que o agente responda de forma mais eficaz.

Menos eficaz: Não forneça informações de pagamento desatualizadas ou faça suposições sobre dados ausentes.
Melhor: Forneça sempre as informações salariais mais recentes disponíveis no sistema oficial de folha de pagamento. Se o pagamento estiver em falta ou incompleto, informe o funcionário de que não consegue localizar os registos atuais e recomende que contacte o RH para obter mais assistência.

5. Definir termos comerciais, abreviaturas e sinónimos

Para garantir que o agente de dados interprete as perguntas corretamente, defina quaisquer termos que possam ser ambíguos, específicos da organização ou específicos do domínio. Essas definições ajudam o agente a aplicar uma lógica consistente e gerar respostas precisas, especialmente quando as perguntas do usuário fazem referência a terminologia interna ou conceitos semelhantes.

Exemplos do que se deve definir

  • Conceitos semelhantes: "calendar year" vs. "fiscal year"
  • Termos comerciais comuns: "quarter", "sales", "SKU", "shoes"
  • Abreviaturas ou siglas: "NPS" (Net Promoter Score), "MAU" (Monthly Ative Users)

Onde colocar as definições

  • Instruções no nível do agente: use isso para definições que se aplicam a todas as fontes de dados e consultas (por exemplo, o que um "trimestre" representa).
  • Instruções da fonte de dados: use isso para definições específicas de como um termo é usado em um determinado conjunto de dados (por exemplo, "vendas" definidas de forma diferente entre sistemas).

6. Use palavras orientadoras para estimular a geração de consultas

Nas instruções da fonte de dados, você pode incluir dicas ou fragmentos de sintaxe SQL/DAX/KQL para orientar o modelo na geração de consultas em um formato específico. Essas "palavras principais" ajudam o agente a inferir a lógica correta ao traduzir linguagem natural em código.

Menos eficaz:
Encontre todos os produtos cujos nomes contenham "bike".

Melhor:
Encontre todos os produtos com nomes contendo "bike"
COMO '%bike%'

A inclusão de fragmentos de sintaxe, como LIKE '%...%' ajuda o modelo a reconhecer que uma cláusula de correspondência de padrões é esperada na consulta. Essa técnica melhora a precisão do SQL gerado, especialmente ao lidar com correspondências parciais, filtros ou junções.

7. Escreva instruções claras e focadas; evitar detalhes desnecessários

As instruções devem ser concisas e propositadas. Inclua apenas as informações necessárias para ajudar o agente a gerar respostas precisas. Evite conteúdo vago, desatualizado ou excessivamente amplo que introduza confusão ou dilua o foco do agente.

Menos eficaz:

You are an HR data agent who should try to help employees with all kinds of questions about work. You have access to many systems, like the HRIS platform, old payroll databases from previous vendors, archived employee files, scanned PDF policy documents, and maybe even some spreadsheets that HR used in the past. If someone asks about their pay, you might want to look in one of the old systems if needed. Also, sometimes data isn't updated immediately, so just do your best. Remember that the company reorganized in 2017, so department names might be different before then. Try to be friendly, but also make sure you don’t seem robotic. Sometimes HR policies change, so answers might not always be the same depending on the date. Just explain if something seems complicated.

Por que isso é menos eficaz?

  • O âmbito é demasiado amplo ("todo o tipo de perguntas sobre o trabalho")
  • Referências a fontes desatualizadas ou não confiáveis (por exemplo, "bancos de dados de folha de pagamento antigos")
  • Falta priorização de fontes de dados
  • Introduz contexto histórico desnecessário
  • Cria ambiguidade com frases como "apenas faça o seu melhor"
  • Carece de orientações claras para o tratamento de dados em falta ou complexos

Melhor:

You are an HR Assistant Agent responsible for answering employee questions about employment status, job details, pay history, and leave balances.  
Use the official HR data warehouse to retrieve current and accurate records.  
If data is missing or unclear, inform the user and recommend they contact HR for further support.  
Keep responses concise, professional, and easy for employees to understand.

Por que isso é melhor?

  • Escopo e responsabilidades claros do agente
  • Referencia a fonte de dados correta sem sobrecarregar os detalhes técnicos
  • Fornece um comportamento de reserva claro
  • Estabelece tom e estilo de comunicação
  • Deixa as especificidades do nível da tabela nas instruções da fonte de dados

8. Escreva instruções detalhadas do agente de dados

As instruções do agente definem como o agente interpreta as perguntas do usuário, seleciona fontes de dados e formata as respostas. Use esta seção para descrever claramente a função do agente, o comportamento esperado, o tom e como ele deve lidar com diferentes tipos de consultas. Inclua detalhes específicos sobre os casos de uso pretendidos, fontes de dados preferidas e comportamento de fallback quando as informações estiverem ausentes.

Sugestão

Ao escrever as instruções do seu agente, pergunte-se: alguém não familiarizado com essas fontes de dados seria capaz de entender quais fontes usar e como usá-las com base nas instruções? Caso contrário, reveja as instruções para incluir o contexto em falta.

Menos eficaz:

You are an agent that helps with HR topics.  
Find answers if possible.  
Try not to give wrong information.  
If you cannot find something, you can tell the user to check elsewhere.  
Answer employee questions about work, pay, and other topics using available systems.  
Keep responses professional.

Melhor:

## Tone and style
Use clear, simple, and professional language.  
Sound friendly and helpful, like an internal HR support agent.  
Avoid technical jargon unless it's part of the business terminology used in the data.

## General knowledge
You are an HR Assistant Agent designed to help employees access accurate information about their employment, benefits, and pay.  
Only answer questions using the official HR data sources provided.  
If multiple records exist, prioritize the most recent and most official source.  
Do not guess or assume answers—if information is missing or unclear, advise the employee to contact HR directly.  

## Data source descriptions
- **Employee Data Warehouse**: Contains employment records including status, role, start date, and department.
- **Payroll System**: Contains pay history, compensation details, and tax withholding information.
- **Benefits Enrollment Database**: Includes information about health insurance, retirement plans, and other employee benefits.
- **HR Policy Lakehouse**: Stores official company policies, including holidays, leave policies, and onboarding documents.

## When asked about
- **Employment status (e.g., active, on leave, terminated)**: Use the *Employee Data Warehouse*  
- **Pay history or compensation**: Use the *Payroll System*  
- **Benefits and enrollment details**: Use the *Benefits Enrollment Database*  
- **Company holidays and leave of absence policies**: Use the *HR Policy Lakehouse*

9. Forneça instruções detalhadas sobre a fonte de dados

As instruções da fonte de dados devem ser específicas, estruturadas e descritivas. Eles orientam o agente na formação de consultas precisas, definindo como os dados são organizados, quais tabelas e colunas são relevantes e como as relações entre tabelas devem ser tratadas.

Use esta seção para descrever:

  • A finalidade da fonte de dados
  • Que tipos de perguntas se pretende responder
  • Colunas obrigatórias a serem incluídas nas respostas
  • Lógica de associação entre tabelas
  • Formatos de valores típicos (por exemplo, abreviaturas vs. nomes completos)

Sugestão

Imagine um novo membro da equipe usando esse conjunto de dados pela primeira vez — ele seria capaz de escrever uma consulta correta apenas seguindo estas instruções?
Caso contrário, adicione o contexto ausente, esclareça suposições ou inclua consultas de exemplo para guiá-las.

Sugestão

O agente de dados não pode ver valores de linha individuais antes de executar uma consulta.
Para orientar a lógica de filtragem, inclua exemplos de valores e formatos típicos — por exemplo, especifique se uma State coluna usa abreviaturas como "CA" ou nomes completos como "California".

Menos eficaz:

## General instructions
Use the EmployeeData warehouse to find answers about employees.  
Try to get useful employee details when needed.

### Employment status
You can use the EmployeeStatusFact table.  
Join to EmployeeDim if necessary.

Melhor:

## General instructions
Use the EmployeeData data warehouse to answer questions related to employee details, employment status, pay history, and organizational structure.

When generating queries:
• Use EmployeeDim as the primary table for employee details.  
• Always include the following columns in the response (if available):  
  - EmployeeID  
  - EmployeeName  
  - EmploymentStatus  
  - JobTitle  
  - DepartmentName  
• Join other tables to EmployeeDim using EmployeeID unless otherwise specified.  
• Filter for the most recent records when applicable.  

Example values:
- EmploymentStatus: "Active", "On Leave", "Terminated"  
- DepartmentName: "Finance", "HR", "Engineering"  
- State: Use U.S. state abbreviations like "CA", "NY", "TX"

## When asked about

When asked about **employee status**, use the `EmployeeStatusFact` table.  
Join it to `EmployeeDim` on `EmployeeID`.  
Filter by the most recent `StatusEffectiveDate` and return the following columns: `EmploymentStatus`, `StatusEffectiveDate`, `EmployeeName`, and `DepartmentName`.

When asked about **current job title or department**, use the `EmployeeDim` table.  
Return `JobTitle` and `DepartmentName`.  
If multiple records exist, filter for the record where `IsCurrent = True`.

10. Use consultas de exemplo para expressar a lógica de consulta complexa

Use consultas de exemplo para ajudar o agente de dados a entender como construir consultas precisas, especialmente quando a lógica é complexa ou matizada. Esses exemplos funcionam como modelos a partir dos quais o agente pode generalizar, mesmo que a pergunta do usuário não seja uma correspondência exata.

  • Inclua exemplos de consultas para tipos de perguntas comuns ou representativos.
  • Concentre-se em exemplos em que a lógica de consulta envolve filtragem, junções, agregações ou manipulação de data.
  • Mantenha a estrutura clara e bem formatada, usando a sintaxe correta para sua fonte de dados (SQL, DAX ou KQL).
  • Você não precisa corresponder literalmente às perguntas do usuário; Os exemplos devem demonstrar intenção e estrutura.

Sugestão

Fornecer uma consulta bem formada é muitas vezes mais claro e eficiente do que tentar explicar a lógica complexa apenas através do texto.

Como as consultas de exemplo são usadas

Para cada pergunta do usuário, o agente de dados executa uma pesquisa de semelhança vetorial para recuperar as 3 principais consultas de exemplo mais relevantes. Em seguida, eles são passados para o prompt aumentado do agente para orientar a geração de consultas.

Próximos passos